当前位置: 首页 > news >正文

Web爬虫-edu_SRC-目标列表爬取

免责声明:本文仅做技术交流与学习...

爬取后,结合暗黑搜索引擎等等进行进一步搜索.

edu_src.py

import requests, time
from bs4 import BeautifulSoup
for i in range(1, 20):url = f'https://src.sjtu.edu.cn/rank/firm/0/?page={i}'print(f"正在获取第{i}页数据")s = requests.get(url).text# print(s)soup = BeautifulSoup(s, 'html.parser')edu1 = soup.find_all('tr')# print(edu1)for edu in edu1:try:edu_name = edu.a.text# print(edu_name)with open('edu_name.txt', 'a+',encoding='utf-8') as f:f.write(edu_name + '\n')except:passprint(f"{i}页已经写入!!!")

相关文章:

  • 精华版 | 2024 Q1全球威胁报告一览
  • 现实网络中排障经验
  • 二开的精美UI站长源码分享论坛网站源码 可切换皮肤界面
  • 信息论与大数据安全知识点
  • 「ClickHouse 极简教程」分布式下的 IN/JOIN 及 GLOBAL关键字
  • jQuery 样式操作
  • leetCode-hot100-链表专题
  • 怎么开启22端口访问权限,让别的机器通过ssh或者向日葵等远程控制工具链接
  • 计算机网络实验(鲁东大学)-cisco-逃课
  • 类Copy方法:BeanUtils.copyProperties
  • Windows系统电脑远程桌面控制本地局域网内树莓派详细教程
  • 客户发票凭证科目
  • Adams Python二次开发教程
  • 行列式和矩阵的区别
  • 60.指针数组和数组指针
  • -------------------- 第二讲-------- 第一节------在此给出链表的基本操作
  • CSS3 聊天气泡框以及 inherit、currentColor 关键字
  • DOM的那些事
  • ES6简单总结(搭配简单的讲解和小案例)
  • JavaScript新鲜事·第5期
  • Laravel Telescope:优雅的应用调试工具
  • miniui datagrid 的客户端分页解决方案 - CS结合
  • 搞机器学习要哪些技能
  • 解决iview多表头动态更改列元素发生的错误
  • 开源中国专访:Chameleon原理首发,其它跨多端统一框架都是假的?
  • 马上搞懂 GeoJSON
  • 爬虫模拟登陆 SegmentFault
  • 我与Jetbrains的这些年
  • 一个普通的 5 年iOS开发者的自我总结,以及5年开发经历和感想!
  • 怎样选择前端框架
  • 你学不懂C语言,是因为不懂编写C程序的7个步骤 ...
  • 新年再起“裁员潮”,“钢铁侠”马斯克要一举裁掉SpaceX 600余名员工 ...
  • 组复制官方翻译九、Group Replication Technical Details
  • # 数论-逆元
  • #define,static,const,三种常量的区别
  • #LLM入门|Prompt#1.7_文本拓展_Expanding
  • #在线报价接单​再坚持一下 明天是真的周六.出现货 实单来谈
  • (2.2w字)前端单元测试之Jest详解篇
  • (4)(4.6) Triducer
  • (C语言)球球大作战
  • (翻译)Entity Framework技巧系列之七 - Tip 26 – 28
  • (附源码)c#+winform实现远程开机(广域网可用)
  • (附源码)php投票系统 毕业设计 121500
  • (几何:六边形面积)编写程序,提示用户输入六边形的边长,然后显示它的面积。
  • (每日持续更新)jdk api之StringBufferInputStream基础、应用、实战
  • (十二)devops持续集成开发——jenkins的全局工具配置之sonar qube环境安装及配置
  • (转)setTimeout 和 setInterval 的区别
  • (转)可以带来幸福的一本书
  • .gitignore文件—git忽略文件
  • .NET CF命令行调试器MDbg入门(一)
  • .NET Framework 的 bug?try-catch-when 中如果 when 语句抛出异常,程序将彻底崩溃
  • .NET(C#、VB)APP开发——Smobiler平台控件介绍:Bluetooth组件
  • .NET/C# 编译期能确定的字符串会在字符串暂存池中不会被 GC 垃圾回收掉
  • [AIGC] Java 和 Kotlin 的区别
  • [Android]创建TabBar