问题:
当headers中缺少指定编码类型时,requests会按照默认的"ISO-8859-1"编码格式处理,
这是一种类ASCII的编码格式、中文就会出现乱码。
如图:
解决办法:
用第二步先获取他真实的编码,更改默认编码格式再.text
req = requests.get(url)
print(req.apparent_encoding) #获取真实编码
req.encoding = "gb2312"
print(req.text)
当headers中缺少指定编码类型时,requests会按照默认的"ISO-8859-1"编码格式处理,
这是一种类ASCII的编码格式、中文就会出现乱码。
如图:
用第二步先获取他真实的编码,更改默认编码格式再.text
req = requests.get(url)
print(req.apparent_encoding) #获取真实编码
req.encoding = "gb2312"
print(req.text)
转载于:https://www.cnblogs.com/testlmh/p/8991029.html