当前位置: 首页 > news >正文

使用python爬取今日头条热搜

今天无意间找到了今日头条热搜的接口链接,顺手写了一个爬取今日头条热搜的爬虫,并保存到excel中
今日头条热搜接口
https://www.toutiao.com/hot-event/hot-board/?origin=toutiao_pc&_signature=_02B4Z6wo00f01yG9tdQAAIDCQrd1vxaJp9chmbFAAKpR4Dqk0c56dkhdlvNsoD3I03ygIjgUcxkM0VcFYKfO0a9iJRjnl1M9yxZvlq-pgzUXDOrpi1wKoYlCVC9.llzChJ7GmTYXIDMvE.c1a6

import json
import re
import openpyxl
import requests
from lxml import etreewb = openpyxl.Workbook()
ws = wb.active
ws.append(['顺序','热搜分类','热搜关键词'])
url = requests.get("https://www.toutiao.com/hot-event/hot-board/?origin=toutiao_pc&_signature=_02B4Z6wo00f01yG9tdQAAIDCQrd1vxaJp9chmbFAAKpR4Dqk0c56dkhdlvNsoD3I03ygIjgUcxkM0VcFYKfO0a9iJRjnl1M9yxZvlq-pgzUXDOrpi1wKoYlCVC9.llzChJ7GmTYXIDMvE.c1a6")
data = json.loads(url.text)['data']
print("data:",data)
for i in data:try:print(f'热搜:{i["Title"]}, 链接为:{i["Url"]},热度:{i["HotValue"]},')ws.append([i["Title"],i["Url"],i["HotValue"]])except:pass
wb.save("今日头条热搜.xlsx")

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 使用EntityFramework8的学习和开发过程中一些经验
  • Webpack、Vite区别知多少?
  • Linux Ubuntu 20.04 netmap安装
  • OD C卷 - 中庸行者
  • 第128天:内网安全-横向移动IPCATSC 命令Impacket 套件CS 插件全自动
  • 代码随想录 day 30 贪心
  • RabbitMQ应用场景及特性
  • PointMC: Multi-instance Point Cloud Registration based on Maximal Cliques 论文解读
  • 经典算法KMP讲解,包含C++解法ACM模式
  • Python脚本实现USB自动复制文件
  • ADC模数转换在stm32上的应用
  • C语言基础题:硬币问题(C语言版)
  • 蚂蚁0511笔试-选择题
  • 9-springCloud集成nacos config
  • btslab靶场-通过xss获取他人cookie并利用
  • 【391天】每日项目总结系列128(2018.03.03)
  • angular2开源库收集
  • exif信息对照
  • jquery cookie
  • Kibana配置logstash,报表一体化
  • Netty 4.1 源代码学习:线程模型
  • Python socket服务器端、客户端传送信息
  • Python打包系统简单入门
  • React-Native - 收藏集 - 掘金
  • SpringCloud集成分布式事务LCN (一)
  • vue 配置sass、scss全局变量
  • 纯 javascript 半自动式下滑一定高度,导航栏固定
  • 从0搭建SpringBoot的HelloWorld -- Java版本
  • 大整数乘法-表格法
  • 高性能JavaScript阅读简记(三)
  • 构建工具 - 收藏集 - 掘金
  • 前端技术周刊 2019-02-11 Serverless
  • 区块链将重新定义世界
  • 无服务器化是企业 IT 架构的未来吗?
  • 学习笔记DL002:AI、机器学习、表示学习、深度学习,第一次大衰退
  • 一起来学SpringBoot | 第三篇:SpringBoot日志配置
  • ​​​​​​​STM32通过SPI硬件读写W25Q64
  • ​LeetCode解法汇总2808. 使循环数组所有元素相等的最少秒数
  • ​渐进式Web应用PWA的未来
  • ​水经微图Web1.5.0版即将上线
  • #include
  • #微信小程序(布局、渲染层基础知识)
  • (03)光刻——半导体电路的绘制
  • (24)(24.1) FPV和仿真的机载OSD(三)
  • (3) cmake编译多个cpp文件
  • (个人笔记质量不佳)SQL 左连接、右连接、内连接的区别
  • (六)Flink 窗口计算
  • (四)TensorRT | 基于 GPU 端的 Python 推理
  • (一) storm的集群安装与配置
  • (杂交版)植物大战僵尸
  • (转)【Hibernate总结系列】使用举例
  • **PyTorch月学习计划 - 第一周;第6-7天: 自动梯度(Autograd)**
  • .net core webapi 大文件上传到wwwroot文件夹
  • .NET Core中的时区转换问题
  • .NET DataGridView数据绑定说明