当前位置: 首页 > news >正文

光学文字识别(OCR)

一、什么是光学文字识别?

简单来说,就是将图片上的文字给识别出来,称为光学文字识别(Optical Character Recognition),简写为OCR。目前市面上这种库并不多,因为做这个需要很强的深度学习功底,而大多数人又不懂这个方面的内容,所以开源的库就更少了,公认的最优秀的开源的OCR库为谷歌赞助开发的Tesseract。

Tesseract是一个开源的OCR引擎,大家均可以免费使用,惠普公司的布里斯托尔实验室在1984-1994年开发完成,起初作为惠普的平板扫描仪的文字识别引擎。Tesseract在1995年UNLV OCR字符识别准确性测试中拔得头筹,受到广泛关注,后来HP放弃了OCR市场,在1994年以后,Tesseract的开发就停止了。

在2005年,HP将Tesseract贡献给开源社区。美国内华达州信息技术研究所获得该源码,同时,Google开始对Tesseract进行功能扩展及优化。目前,Tesseract作为开源项目发布在Google Project上,重获新生,它支持60种以上的语言,提供一个引擎和一个命令行工具。

二、安装tesseract-ocr

1.双击可执行文件。

2.按照步骤安装即可。

3.设置环境变量

(1)训练数据文件环境变量【环境变量必须为这个名字

TESSDATA_PREFIX=D:\study\Tesseract-OCR\tessdata

(2)tesseract.exe环境变量

在Path中直接添加即可。

三、在命令行使用tesseract-ocr

1.将【tesseract.exe】所在的文件夹添加到环境变量里面。

2.使用cmd进入到想识别的图片的所在的文件夹内。

使用方法:tesseract   eg.png(文件名)    eg(识别结果存放的文件)

3.识别中文

使用方法:tesseract   eg.png(文件名)    eg(识别结果存放的文件)  -l   chi_sim

四、在Python中使用tesseract-ocr

1.Python需要安装对应的库

(1)在线安装:

pip install pytesseract

(2)离线安装:

下载对应的.whl文件即可安装。

示例博客地址:https://blog.csdn.net/weixin_42830697/article/details/102492605

2.查看对应的版本

3.测试是否安装成功

执行导入操作未报错即表示安装成功!!

 

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • Microsoft Exchange Server 1000
  • 三、基础查询——MySQL数据库之查看列(1)
  • 应用程序池 'DefaultAppPool' 的模板永久性缓存初始化失败 | Active Server Pages 5
  • 5.MySQL数据库之排序检索数据
  • MAD 监视线程无法读取服务的状态,错误“0x80041033” | MSExchangeSA 9099
  • 6.MySQL数据库之过滤数据
  • Exchange 2003 公用文件夹 c1030af7
  • 7.MySQL数据库之数据过滤
  • MySQL中的各种函数
  • W3SVC 1013 IIS进程锁死
  • MySQL——基础查询【1】
  • 如何在 IIS 6.0 中 ASP.NET 锁死的情况下生成转储文件
  • 四、使用数据处理函数——数值处理函数(1)
  • 1.Mysql数据库——初识创建表
  • 微软的blog开放注册
  • 【108天】Java——《Head First Java》笔记(第1-4章)
  • 07.Android之多媒体问题
  • Asm.js的简单介绍
  • el-input获取焦点 input输入框为空时高亮 el-input值非法时
  • Rancher-k8s加速安装文档
  • Redis 中的布隆过滤器
  • Redis的resp协议
  • Work@Alibaba 阿里巴巴的企业应用构建之路
  • 初识 beanstalkd
  • 前端代码风格自动化系列(二)之Commitlint
  • 驱动程序原理
  • 小程序开发之路(一)
  • 阿里云服务器如何修改远程端口?
  • #LLM入门|Prompt#1.8_聊天机器人_Chatbot
  • #php的pecl工具#
  • #鸿蒙生态创新中心#揭幕仪式在深圳湾科技生态园举行
  • #我与Java虚拟机的故事#连载03:面试过的百度,滴滴,快手都问了这些问题
  • #我与Java虚拟机的故事#连载11: JVM学习之路
  • $forceUpdate()函数
  • (1)(1.13) SiK无线电高级配置(六)
  • (145)光线追踪距离场柔和阴影
  • (52)只出现一次的数字III
  • (C#)Windows Shell 外壳编程系列4 - 上下文菜单(iContextMenu)(二)嵌入菜单和执行命令...
  • (delphi11最新学习资料) Object Pascal 学习笔记---第14章泛型第2节(泛型类的类构造函数)
  • (html5)在移动端input输入搜索项后 输入法下面为什么不想百度那样出现前往? 而我的出现的是换行...
  • (搬运以学习)flask 上下文的实现
  • (附源码)ssm高校运动会管理系统 毕业设计 020419
  • (附源码)SSM环卫人员管理平台 计算机毕设36412
  • (利用IDEA+Maven)定制属于自己的jar包
  • (篇九)MySQL常用内置函数
  • (四)事件系统
  • (转) ns2/nam与nam实现相关的文件
  • ****三次握手和四次挥手
  • .FileZilla的使用和主动模式被动模式介绍
  • .Net Core 生成管理员权限的应用程序
  • .net core 外观者设计模式 实现,多种支付选择
  • .net core使用EPPlus设置Excel的页眉和页脚
  • .NET Framework与.NET Framework SDK有什么不同?
  • .net 前台table如何加一列下拉框_如何用Word编辑参考文献
  • .NET/C# 检测电脑上安装的 .NET Framework 的版本