当前位置：首页 > news >正文

python采集火热弹幕数据并做词云图可视化分析

news 来源：原创 2024/5/19 16:50:52

前言

嗨喽，大家好呀~这里是爱看美女的茜茜呐

又到了学Python时刻~

这里写目录标题

- 前言
- 知识点介绍:
- 环境介绍:
- 代码实现:
- 代码
- 词云图
- 尾语 💝

知识点介绍:

爬虫基本思路流程
requests模块的使用
pandas保存表格数据
pyecharts做词云图可视化

环境介绍:

python 3.8
pycharm
requests >>> pip install requests
pyecharts >>> pip install pyecharts

代码实现:

发送请求
获取数据
解析数据
保存数据

代码

源码点击蓝色字体自取，我都放在这里了。

import requests     # 发送请求 第三方模块
import csv

with open('弹幕.csv', encoding='utf-8-sig', mode='a', newline='') as f:
    csv_writer = csv.writer(f)
    csv_writer.writerow(['commentid', 'opername', 'content'])

# 伪装
headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.74 Safari/537.36'
}

1. 发送请求

    response = requests.get(url=url, headers=headers)

<Response [200]>: 请求成功

2. 获取数据

从一个字符串变成了一个字典 (容器)

    json_data = response.json()

3. 解析数据

新华字典 = {‘键1’: {‘键5’: ‘值5’},‘键2’: ‘值2’,‘键3’: ‘值3’}

新华字典[‘键1’][‘键5’]

a = [1,3,5,7,9]: 列表数据容器

a[2]

    for comment in json_data['comments']:
        commentid = comment['commentid']
        opername = comment['opername']
        content = comment['content']
        with open('弹幕.csv', encoding='utf-8-sig', mode='a', newline='') as f:
            csv_writer = csv.writer(f)
            csv_writer.writerow([commentid, opername, content])

词云图

源码点击蓝色字体自取，我都放在这里了。

文章看不懂，我专门录了对应的视频讲解，本文只是大致展示，完整代码和视频教程点击下方蓝字

点击蓝色字体自取，我都放在这里了。

尾语 💝

感谢你观看我的文章呐~本次航班到这里就结束啦 🛬

希望本篇文章有对你带来帮助 🎉，有学习到一点知识~

躲起来的星星🍥也在努力发光，你也要努力加油（让我们一起努力叭）。

最后，博主要一下你们的三连呀（点赞、评论、收藏），不要钱的还是可以搞一搞的嘛~

不知道评论啥的，即使扣个6666也是对博主的鼓舞吖 💞 感谢 💐

相关文章：

【小程序从0到1】模版与配置｜数据绑定｜事件绑定

NetSuite SuiteQL Query Tool

功能异常强大，推荐这款 Python 时序异常检测神器

串的存储结构 --王道

React路由规则的定义、声明式导航、编程式导航

Java_四种内部类

Java lang包简介说明

推荐一款替代Navicat的MySQL数据库管理工具-HeidSQL

R语言使用lm函数构建分层线性回归模型（添加分组变量构建分层线性回归模型）、使用summary函数获取分层线性回归模型汇总统计信息

Maven坐标查找方法及Maven-Search 插件的使用（保姆级教学）

搭建nodejs环境

【Android】之屏幕适配

【JavaScript】五个常用功能/案例：计时器 | 流程控制 | 闭包应用 | arguments剩余参数 | 二次封装函数

Java Applet

回归分析与模型诊断——作业

《微软的软件测试之道》成书始末、出版宣告、补充致谢名单及相关信息

【从零开始安装kubernetes-1.7.3】2.flannel、docker以及Harbor的配置以及作用

【跃迁之路】【477天】刻意练习系列236（2018.05.28）

CSS进阶篇--用CSS开启硬件加速来提高网站性能

EventListener原理

express如何解决request entity too large问题

gulp 教程

JS函数式编程数组部分风格 ES6版

Python爬虫--- 1.3 BS4库的解析器

Spark VS Hadoop：两大大数据分析系统深度解读

webpack入门学习手记（二）

当SetTimeout遇到了字符串

浮动相关

判断客户端类型，Android，iOS，PC

前言-如何学习区块链

实习面试笔记

使用 Docker 部署 Spring Boot项目

使用 Node.js 的 nodemailer 模块发送邮件（支持 QQ、163 等、支持附件）

使用 Xcode 的 Target 区分开发和生产环境

探索 JS 中的模块化

小程序上传图片到七牛云（支持多张上传，预览，删除）

协程

一份游戏开发学习路线

zabbix3.2监控linux磁盘IO

iOS实时查看App运行日志

无人机石油管道巡检方案新亮点：灵活准确又高效

#、%和$符号在OGNL表达式中经常出现

#我与Java虚拟机的故事#连载18：JAVA成长之路

$emit传递多个参数_PPC和MIPS指令集下二进制代码中函数参数个数的识别方法

(C++17) optional的使用

（Redis使用系列） Springboot 实现Redis 同数据源动态切换db 八

(搬运以学习)flask 上下文的实现

（附源码）springboot炼糖厂地磅全自动控制系统毕业设计 341357

(过滤器)Filter和(监听器)listener

（机器学习-深度学习快速入门）第一章第一节：Python环境和数据分析

（六）软件测试分工

（学习日记）2024.01.09

（一）插入排序

(转载)Linux 多线程条件变量同步

******之网络***——物理***