当前位置: 首页 > news >正文

用python生成词频云图(python实例二十一)

目录

1.认识Python

2.环境与工具

2.1 python环境

2.2 Visual Studio Code编译

3.词频云图

3.1 代码构思

3.2 代码实例

3.3 运行结果

4.总结


1.认识Python

Python 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。

Python 的设计具有很强的可读性,相比其他语言经常使用英文关键字或标点符号,它具有比其他语言更有特色的语法结构。

2.环境与工具

2.1 python环境

在Windows上使用命令行窗口查看所安装的python版本

python --version

 

2.2 Visual Studio Code编译

Visual Studio Code是一款由微软开发且跨平台的免费源代码编辑器。该软件以扩展的方式支持语法高亮、代码自动补全、代码重构功能,并且内置了命令行工具和Git 版本控制系统。

3.词频云图

3.1 代码构思

使用词频云图模块库wordcloud、画图模板库matplotlib、中文分词库jieba,读入文本文件、图片文件,然后通过分词进行文本解析,然后绘制最终的词频云图。

3.2 代码实例

from wordcloud import WordCloud, STOPWORDS
import matplotlib.pyplot as plt
import jieba# 文件路径
filename = 'test2.txt'# 读取文本文件
with open(filename, encoding='utf-8') as f:vtext = f.read()# 使用 jieba 分词
vtext = ' '.join(jieba.cut(vtext))# 读取背景图片
img = plt.imread('1.png')# 获取默认的屏蔽词,并添加自定义屏蔽词
stopwords = set(STOPWORDS)
vstop = ['没有', '还有', '不是', '只是', '说到']
for i in vstop:stopwords.add(i)# 生成词云对象
wordcloud = WordCloud(font_path='./part4/cangekuheiziti.ttf',background_color='white',max_words=200,mask=img,stopwords=stopwords
).generate(vtext)# 显示词频云图
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')  # 设置图形坐标# 显示图形
plt.show()# 保存图形
wordcloud.to_file('wordcloud_output.jpg')

3.3 运行结果

4.总结

在程序运行前要保证文本文件1.txt文件内有文本,这样才能根基文本文件中词语出现的频率生成最终的词频图,还有要注意要有.ttf字体文件以及背景图片。

自己运行起来试试看吧!

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 升级springboot3.2集成shiro的问题
  • 京准电钟:云计算中NTP网络时间服务器的作用是什么?
  • Open3D 计算点云FPFH特征
  • Mongodb索引使用限制
  • 【spark】Exception in thread “main“ ExitCodeException exitCode=-1073741701
  • 记录一次微信小程序申诉定位权限过程
  • Spring Boot 事件监听机制实战【自定义 Spring Boot 事件监听】
  • MACOS查看硬盘读写量
  • 【JavaWeb程序设计】Servlet(二)
  • linux 内核 红黑树接口说明
  • 股票分析系统设计方案大纲与细节
  • 基于对称点模式SDP(SDP, symmetrized dot pattern)轴承故障诊断方法(matlab和python实现开源)
  • 高并发内存池联调问题
  • 链表 OJ(一)
  • LIO-SAM编译ubuntu20.04 Noetic
  • CentOS学习笔记 - 12. Nginx搭建Centos7.5远程repo
  • Effective Java 笔记(一)
  • Facebook AccountKit 接入的坑点
  • JavaScript 事件——“事件类型”中“HTML5事件”的注意要点
  • javascript从右向左截取指定位数字符的3种方法
  • JSDuck 与 AngularJS 融合技巧
  • js作用域和this的理解
  • nodejs:开发并发布一个nodejs包
  • redis学习笔记(三):列表、集合、有序集合
  • Windows Containers 大冒险: 容器网络
  • 百度小程序遇到的问题
  • 纯 javascript 半自动式下滑一定高度,导航栏固定
  • 好的网址,关于.net 4.0 ,vs 2010
  • 使用common-codec进行md5加密
  • 使用SAX解析XML
  • 数据仓库的几种建模方法
  • 写代码的正确姿势
  • 学习笔记DL002:AI、机器学习、表示学习、深度学习,第一次大衰退
  • 怎么将电脑中的声音录制成WAV格式
  • elasticsearch-head插件安装
  • 说说我为什么看好Spring Cloud Alibaba
  • ​学习一下,什么是预包装食品?​
  • (04)odoo视图操作
  • (2)MFC+openGL单文档框架glFrame
  • (4)事件处理——(7)简单事件(Simple events)
  • (C)一些题4
  • (C语言)输入一个序列,判断是否为奇偶交叉数
  • (附源码)spring boot北京冬奥会志愿者报名系统 毕业设计 150947
  • (附源码)ssm考生评分系统 毕业设计 071114
  • (九十四)函数和二维数组
  • (转)负载均衡,回话保持,cookie
  • .NET 3.0 Framework已经被添加到WindowUpdate
  • .net CHARTING图表控件下载地址
  • .NET CORE Aws S3 使用
  • .Net Core 笔试1
  • .NET Core 中的路径问题
  • .net core使用RPC方式进行高效的HTTP服务访问
  • .Net mvc总结
  • .net 使用ajax控件后如何调用前端脚本
  • .net 受管制代码