当前位置: 首页 > news >正文

用chardet判断字符编码的方法

chardet 用来实现字符串/文件编码检测模板

1、chardet下载与安装

下载地址:http://pypi.python.org/pypi/chardet

下载chardet后,解压chardet压缩包,直接将chardet文件夹放在应用程序目录下,就可以使用import chardet开始使用chardet了,也可以将chardet拷贝到Python系统目录下,这样你所有的python程序只要用import chardet就可以了。

python setup.py install

2、实例

使用中,chardet.detect()返回字典,其中confidence是检测精确度,encoding是编码形式

(1)网页编码判断:

>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.cn/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}

(2)文件编码判断

import chardet
tt=open('c:\\111.txt','rb')
ff=tt.readline()
#这里试着换成read(5)也可以,但是换成readlines()后报错
enc=chardet.detect(ff)
print enc['encoding']
tt.close()





相关文章:

  • 再生龙使用
  • ios开发使用UIWebView显示多种文档
  • 来个狠的
  • Nagios之图形化Pnp 安装和配置(转)
  • 拯救自己的wifi
  • [转载] 姚仁禄先生的创意讲座(09上)——01 什么是设计
  • 【HTML+CSS+JavaScript】网页实战开发笔记之二—关于Web标准,你不能不知道的事
  • 文章的上一篇和下一篇导航
  • Go语言写Web 应用程序
  • 注册表操作技巧及键值类型的判断
  • 迎接“云”时代的全面到来
  • QMenu,QT的菜单添加
  • Android开发基本篇(二)
  • Java的主要特性?
  • 为WP7添加动态Tile
  • (ckeditor+ckfinder用法)Jquery,js获取ckeditor值
  • [译] 理解数组在 PHP 内部的实现(给PHP开发者的PHP源码-第四部分)
  • 【159天】尚学堂高琪Java300集视频精华笔记(128)
  • 【407天】跃迁之路——程序员高效学习方法论探索系列(实验阶段164-2018.03.19)...
  • 【翻译】babel对TC39装饰器草案的实现
  • 【腾讯Bugly干货分享】从0到1打造直播 App
  • CSS3 聊天气泡框以及 inherit、currentColor 关键字
  • DataBase in Android
  • docker python 配置
  • exports和module.exports
  • JavaScript 无符号位移运算符 三个大于号 的使用方法
  • JavaScript标准库系列——Math对象和Date对象(二)
  • Python实现BT种子转化为磁力链接【实战】
  • Redis中的lru算法实现
  • vue从创建到完整的饿了么(18)购物车详细信息的展示与删除
  • 给新手的新浪微博 SDK 集成教程【一】
  • 前端工程化(Gulp、Webpack)-webpack
  • 什么软件可以提取视频中的音频制作成手机铃声
  • 手机app有了短信验证码还有没必要有图片验证码?
  • 译有关态射的一切
  • 函数计算新功能-----支持C#函数
  • 新海诚画集[秒速5センチメートル:樱花抄·春]
  • !!【OpenCV学习】计算两幅图像的重叠区域
  • ${ }的特别功能
  • (1)bark-ml
  • (js)循环条件满足时终止循环
  • (SpringBoot)第七章:SpringBoot日志文件
  • (二)斐波那契Fabonacci函数
  • (仿QQ聊天消息列表加载)wp7 listbox 列表项逐一加载的一种实现方式,以及加入渐显动画...
  • (附源码)node.js知识分享网站 毕业设计 202038
  • (附源码)springboot 智能停车场系统 毕业设计065415
  • (十二)python网络爬虫(理论+实战)——实战:使用BeautfulSoup解析baidu热搜新闻数据
  • (四)docker:为mysql和java jar运行环境创建同一网络,容器互联
  • (转)EXC_BREAKPOINT僵尸错误
  • (转)原始图像数据和PDF中的图像数据
  • .cn根服务器被攻击之后
  • .mkp勒索病毒解密方法|勒索病毒解决|勒索病毒恢复|数据库修复
  • .NET Core实战项目之CMS 第十二章 开发篇-Dapper封装CURD及仓储代码生成器实现
  • .netcore 获取appsettings
  • .net反编译工具