Python爬虫实例--新浪热搜榜[正则表达式]
Python爬虫实例--新浪热搜榜[正则表达式]
1.基础环境配置:
requests-->版本:2.12.4
re-->:Python自带,无需安装
2.网页分析
很容易从html源码中看到,热搜内容在html的<a></a>标签内,热度在<span></span>标签内,我们可以利用这一点用正则表达式进行数据抓取。
3.代码编写
4.结果保存:
将提取结果保存在excel里面。
扫描二维码即可参与该课程,解锁更多爬虫知识: