当前位置: 首页 > news >正文

Python常见问题整理

                                                   Python常见问题整理

 

日常使用python时,经常遇到的各种解决不了、头疼的问题,都可以记录到这里,大家群策群力,积极补充~

 
序号问题标题问题现象原因解决方法参考文章添加人报错截图
0ModuleNotFoundError代码运行报错ModuleNotFoundError库没安装见第二个sheet页:ModuleNotFoundError见第二个sheet页:ModuleNotFoundError马哥 
1pycharm安装第三方库失败在pycharm中安装第三方库失败python默认的安装源地址是国外的,所以偶尔会遇到安装失败的问题。以安装pandas库为例,在命令行(windows系统的cmd,Mac系统的terminal)里执行:(-i选项,代表python安装源地址,这里用到清华大学的安装源)
pip install pandas -i https://pypi.tuna.tsinghua.edu.cn/simple
马哥python说 的想法: 社群里小伙伴近期频繁遇到的问题:pychar… - 知乎马哥 
2pycharm已经安装了第三方库,还是提示导入失败比如,在cmd命令行用pip install安装好了第三方库,在pycharm中import这个库的时候,依然显示没安装。电脑上存在多个python运行环境(比如,cmd里是py3.7,pycharm里是py3.9)在pycharm中安装第三方库,不要在cmd命令行中安装。或者,
在目标python安装目录的Scripts下面,用pip安装。
Pycharm安装第三方库的三种方法_nufe_wwt的博客-CSDN博客_pycharm安装第三方库马哥 
3jupyter notebook里已经安装了第三方库,还是提示导入失败jupyter notebook里已经安装了第三方库,还是提示导入失败电脑上存在多个python运行环境(比如,cmd里是py3.7,jupyter notebook里是py3.9)在jupyter中安装第三方库,不要在cmd命令行中安装。
比如,在单元格里执行:

!pip install pandas
https://www.zhihu.com/question/59392251/answer/560977151https://blog.csdn.net/weixin_43999124/article/details/108623799马哥 
4爬虫获取不到数据在用python爬虫向目标地址发送请求时,返回的响应码是非200,比如403、404等,而且获取不到任何页面数据1、被目标服务器检测到爬虫,被反爬了
2、如果响应码是404,找不到页面,很有可能是请求的URL地址不对
解决反爬的方法:
1、模拟请求头
2、伪造请求cookie
3、随机等待间隔
4、使用代理IP
5、验证码破解
【道高一尺,魔高一丈】Python爬虫之如何应对网站反爬虫策略 - 知乎马哥 
5if语句判断相等时报语法错误if语句判断是否相等时,报语法错误的异常:
SyntaxError: invalid syntax
python中,=代表赋值,==代表判断两个变量是否相等。
如果用反了,就会出现上面的报错。
用"=="判断变量是否相等,比如:
if a == 2:
python中的=与==有什么区别? - 知乎马哥 
6用pandas保存csv文件时乱码用pandas库的to_csv函数保存csv文件时,保存进去的内容打开之后显示乱码乱码问题最头疼,编码格式跟操作系统默认环境、pycharm等IDE工具配置都有关系to_csv时,加一个参数:
encoding='utf_8_sig'
即,用utf_8_sig的编码格式保存文件。
【python爬虫案例】用python爬取B站TOP100排行榜数据 - 知乎马哥 
7爬虫分析时,捕获不到页面请求开发python爬虫代码时,在浏览器的开发者模式里面,检测不到目标链接的请求未触发页面请求,所以是空白的点击对应的页面元素,触发一次页面请求。【Python科普】讲解python爬虫如何通过分析前端页面,正确捕获页面请求_哔哩哔哩_bilibili马哥 
8安装第三方库wordcloud库失败安装wordcloud或其他第三方库时,报错:error: Microsoft Visual C++ 14.0 or greater is required总体而言,是电脑运行环境中缺少系统文件导致,此问题比较棘手。解决办法:
1、通过whl文件离线安装,参考:
https://www.pythonf.cn/read/61234
2、升级电脑上的Visual C++版本,参考:
https://www.codeleading.com/article/74141818258/
https://www.pythonf.cn/read/61234https://www.codeleading.com/article/74141818258/https://www.bilibili.com/video/BV1bt4y1y7sU马哥 
9.1爬虫爬到的是乱码爬到的内容中,有很多类似:"Title":"\u56fd\u5916\u65b0\u578b\u80ba\u708e\u6700\u65b0\u52a8\u6001结果中包含unicode编码在用python做爬虫的时候经常会与到结果中包含unicode编码,需要将结果转化为中文,处理方式如下:
str.encode('utf-8').decode('unicode_escape')
https://www.cnblogs.com/CoolJayson/p/10469306.htmlhttps://blog.csdn.net/q1246192888/article/details/119424408马哥 
9.2爬虫爬到的是乱码爬到的内容中,有很多类似:<title>ÕÐƸÍø_È˲ÅÍø_ÕÒ¹¤×÷_ÇóÖ°_ÉÏÇ°³ÌÎÞÓÇ</title>结果中编码格式不对最简单的办法:
r.encoding = r.apparent_encoding
如何解决python爬虫乱码问题_giunwr的博客-CSDN博客_爬虫打印乱码马哥 
10pycharm界面运行后会显示乱码
 
pycharm设置编码格式问题在pycharm里,file–settings–code style–file encodings,设置为"GBK"就可以解决问题解决在pycharm运行代码,调用CMD窗口的命令运行显示乱码问题_python_脚本之家  
11爬百度搜索时,爬到的数据量为0
 
大概率是编码格式不对,导致内容乱码,所以解析不到相应的页面数据如果爬取到的数据是0,说明乱码了(可以把r.text给print一下,执行一看就是乱码)。
0、尝试更换cookie值。
1、试试换成用anaconda里的python执行,就能解决。
2、试试把请求头中的Accept-Encoding里的br去掉。
https://www.bilibili.com/video/BV1j94y1f7fD/https://www.bilibili.com/video/BV1ob4y1W7qj/马哥 
12词云图不是按背景图绘制出来的词云图的结果,还是一个矩形图,不是背景图形状背景图不是纯白色(有时看上去是白色,其实不是,用取色器看一下就知道了)先把图片去背景,然后贴到白色画布上,截图,这样出来的背景图才能用于词云马哥 
13read_csv失败pandas在read_csv时,报错:OSError: Initializing from file failed文件路径中包含了中文,由于read_csv函数的默认引擎engine为C,不支持对中文的识别,导致报该错误。在使用notebook打开文件时常见这个问题。更改engine='python'即可执行成功。
df=pd.read_csv('123.csv',engine='python')
python报OSError: Initializing from file failed故障_北.海的博客-CSDN博客马哥 
14爬虫代码bs4报错Couldn't find a tree builder with the features you requested: lxmlBeautifulSoup的解析方法之一,xml,需要安装好lxml库才行用常规安装库的方法就行:
pip install lxml
https://blog.csdn.net/qq_41621362/article/details/93410344https://www.zhihu.com/question/268088532马哥 
15.1pyecharts图表不显示pyecharts开发的可视化图表html文件打开之后是空白,没有任何显示由于PyEcharts在升级到1.x版本后,将原来HTML网页中使用到的很多js文件换为了在线获取的方式win10 win11下可按此种方法解决解决离线状态下使用PyEcharts进行数据可视化绘图时,pyecharts-gallery示例库中的所有html网页打不开、不出图的问题_superchao1982的博客-CSDN博客_pyecharts-gallery马哥 
15.2pyecharts大屏不显示个别子图表pyecharts大屏不显示个别子图表,比如,开发了5个子图表,只显示出4个,有1个没显示出来有可能是子图表的chart_id重复了chart_id是每个子图表的唯一标识id,不能重复,一旦重复,子图表数量就会缺失马哥 
16爬虫请求校验SSL失败爬虫报错:requests.exceptions.SSLError: HTTPSConnectionPool发送请求时校验SSL失败1、在 requests.get 请求中加入 verify=False
2、网络问题,把你的vpn关掉,再爬
https://www.cnblogs.com/mlllily/p/12134621.htmlhttps://blog.csdn.net/qq_31698363/article/details/121324551马哥 

相关文章:

  • Docker安装Zookeeper教程(超详细)
  • 【学习笔记12.25】动态规划入门
  • C语言用好写好头文件
  • 程序员过圣诞 | 用HTML写出绽放的烟花
  • 源码系列 之 HashMap
  • docker logs实时查看日志tail
  • Win10从零安装、训练、部署yolov5 6.x一条龙实战案例
  • 东北大学c++实验最后一次
  • 十六、Docker Compose容器编排第一篇
  • 时序预测 | MATLAB实现IWOA-LSTM和LSTM时间序列预测(改进的鲸鱼算法优化长短期记忆神经网络)
  • CSS预处理语言LESS与SCSS的介绍
  • 互联网摸鱼日报(2022-12-26)
  • 【Python学习记录】matplotlib绘图基本配置
  • java语言的resource 接口
  • 【C语言进阶】想用好C++?那就一定要掌握动态内存管理
  • php的引用
  • #Java异常处理
  • (ckeditor+ckfinder用法)Jquery,js获取ckeditor值
  • (三)从jvm层面了解线程的启动和停止
  • Java精华积累:初学者都应该搞懂的问题
  • LeetCode刷题——29. Divide Two Integers(Part 1靠自己)
  • log4j2输出到kafka
  • Perseus-BERT——业内性能极致优化的BERT训练方案
  • php中curl和soap方式请求服务超时问题
  • Spark VS Hadoop:两大大数据分析系统深度解读
  • SpiderData 2019年2月23日 DApp数据排行榜
  • spring-boot List转Page
  • Sublime Text 2/3 绑定Eclipse快捷键
  • Webpack 4x 之路 ( 四 )
  • 从零搭建Koa2 Server
  • 深入浅出Node.js
  • 数据科学 第 3 章 11 字符串处理
  • 突破自己的技术思维
  • 详解移动APP与web APP的区别
  • 用Python写一份独特的元宵节祝福
  • 正则表达式
  • 组复制官方翻译九、Group Replication Technical Details
  • ###STL(标准模板库)
  • #AngularJS#$sce.trustAsResourceUrl
  • #Z2294. 打印树的直径
  • #每日一题合集#牛客JZ23-JZ33
  • #我与Java虚拟机的故事#连载09:面试大厂逃不过的JVM
  • $jQuery 重写Alert样式方法
  • (1)(1.8) MSP(MultiWii 串行协议)(4.1 版)
  • (16)UiBot:智能化软件机器人(以头歌抓取课程数据为例)
  • (delphi11最新学习资料) Object Pascal 学习笔记---第5章第5节(delphi中的指针)
  • (附源码)计算机毕业设计大学生兼职系统
  • (理论篇)httpmoudle和httphandler一览
  • (转)创业家杂志:UCWEB天使第一步
  • (转)大道至简,职场上做人做事做管理
  • .net core Swagger 过滤部分Api
  • .NET MVC、 WebAPI、 WebService【ws】、NVVM、WCF、Remoting
  • .netcore 获取appsettings
  • /var/log/cvslog 太大
  • [ vulhub漏洞复现篇 ] Django SQL注入漏洞复现 CVE-2021-35042