当前位置: 首页 > news >正文

python采集火热弹幕数据并做词云图可视化分析

前言

嗨喽,大家好呀~这里是爱看美女的茜茜呐

又到了学Python时刻~


这里写目录标题

    • 前言
    • 知识点介绍:
    • 环境介绍:
    • 代码实现:
    • 代码
    • 词云图
    • 尾语 💝


知识点介绍:

  • 爬虫基本思路流程

  • requests模块的使用

  • pandas保存表格数据

  • pyecharts做词云图可视化


环境介绍:

  • python 3.8

  • pycharm

  • requests >>> pip install requests

  • pyecharts >>> pip install pyecharts


代码实现:

  1. 发送请求
  2. 获取数据
  3. 解析数据
  4. 保存数据

代码

源码点击 蓝色字体 自取,我都放在这里了。

import requests     # 发送请求 第三方模块
import csv
with open('弹幕.csv', encoding='utf-8-sig', mode='a', newline='') as f:
    csv_writer = csv.writer(f)
    csv_writer.writerow(['commentid', 'opername', 'content'])
# 伪装
headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.74 Safari/537.36'
}

1. 发送请求

    response = requests.get(url=url, headers=headers)

<Response [200]>: 请求成功

2. 获取数据

从一个字符串 变成了一个 字典 (容器)

    json_data = response.json()

3. 解析数据

新华字典 = {‘键1’: {‘键5’: ‘值5’},‘键2’: ‘值2’,‘键3’: ‘值3’}

新华字典[‘键1’][‘键5’]

a = [1,3,5,7,9]: 列表 数据容器

a[2]

    for comment in json_data['comments']:
        commentid = comment['commentid']
        opername = comment['opername']
        content = comment['content']
        with open('弹幕.csv', encoding='utf-8-sig', mode='a', newline='') as f:
            csv_writer = csv.writer(f)
            csv_writer.writerow([commentid, opername, content])

词云图

源码点击 蓝色字体 自取,我都放在这里了。



文章看不懂,我专门录了对应的视频讲解,本文只是大致展示,完整代码和视频教程点击下方蓝字

点击 蓝色字体 自取,我都放在这里了。

尾语 💝

感谢你观看我的文章呐~本次航班到这里就结束啦 🛬

希望本篇文章有对你带来帮助 🎉,有学习到一点知识~

躲起来的星星🍥也在努力发光,你也要努力加油(让我们一起努力叭)。

最后,博主要一下你们的三连呀(点赞、评论、收藏),不要钱的还是可以搞一搞的嘛~

不知道评论啥的,即使扣个6666也是对博主的鼓舞吖 💞 感谢 💐

相关文章:

  • 【小程序从0到1】模版与配置|数据绑定|事件绑定
  • NetSuite SuiteQL Query Tool
  • 功能异常强大,推荐这款 Python 时序异常检测神器
  • 串的存储结构 --王道
  • React路由规则的定义、声明式导航、编程式导航
  • Java_四种内部类
  • Java lang包简介说明
  • 推荐一款替代Navicat的MySQL数据库管理工具-HeidSQL
  • R语言使用lm函数构建分层线性回归模型(添加分组变量构建分层线性回归模型)、使用summary函数获取分层线性回归模型汇总统计信息
  • Maven坐标查找方法及Maven-Search 插件的使用(保姆级教学)
  • 搭建nodejs环境
  • 【Android】之屏幕适配
  • 【JavaScript】五个常用功能/案例:计时器 | 流程控制 | 闭包应用 | arguments剩余参数 | 二次封装函数
  • Java Applet
  • 回归分析与模型诊断——作业
  • 《微软的软件测试之道》成书始末、出版宣告、补充致谢名单及相关信息
  • 【从零开始安装kubernetes-1.7.3】2.flannel、docker以及Harbor的配置以及作用
  • 【跃迁之路】【477天】刻意练习系列236(2018.05.28)
  • CSS进阶篇--用CSS开启硬件加速来提高网站性能
  • EventListener原理
  • express如何解决request entity too large问题
  • gulp 教程
  • JS函数式编程 数组部分风格 ES6版
  • Python爬虫--- 1.3 BS4库的解析器
  • Spark VS Hadoop:两大大数据分析系统深度解读
  • webpack入门学习手记(二)
  • 当SetTimeout遇到了字符串
  • 浮动相关
  • 判断客户端类型,Android,iOS,PC
  • 前言-如何学习区块链
  • 实习面试笔记
  • 使用 Docker 部署 Spring Boot项目
  • 使用 Node.js 的 nodemailer 模块发送邮件(支持 QQ、163 等、支持附件)
  • 使用 Xcode 的 Target 区分开发和生产环境
  • 探索 JS 中的模块化
  • 小程序上传图片到七牛云(支持多张上传,预览,删除)
  • 协程
  • 一份游戏开发学习路线
  • zabbix3.2监控linux磁盘IO
  • ​iOS实时查看App运行日志
  • ​无人机石油管道巡检方案新亮点:灵活准确又高效
  • #、%和$符号在OGNL表达式中经常出现
  • #我与Java虚拟机的故事#连载18:JAVA成长之路
  • $emit传递多个参数_PPC和MIPS指令集下二进制代码中函数参数个数的识别方法
  • (C++17) optional的使用
  • (Redis使用系列) Springboot 实现Redis 同数据源动态切换db 八
  • (搬运以学习)flask 上下文的实现
  • (附源码)springboot炼糖厂地磅全自动控制系统 毕业设计 341357
  • (过滤器)Filter和(监听器)listener
  • (机器学习-深度学习快速入门)第一章第一节:Python环境和数据分析
  • (六)软件测试分工
  • (学习日记)2024.01.09
  • (一)插入排序
  • (转载)Linux 多线程条件变量同步
  • ******之网络***——物理***