当前位置: 首页 > news >正文

OCR文字识别接口如何用PHP进行调用

一、什么是OCR文字识别接口?

OCR文字识别接口,是指将图像中文字内容进行识别,例如可以识别照片中的文字信息,方便对文档、书籍、名片等各种载体上的文字进行数字化处理。

二、OCR文字识别接口适用于哪些场景?

例如:

1.办公自动化领域

(1)文档转换和数字化:可将纸质文档、书籍、报纸、合同、简历等大量纸质文件快速转换成可编辑和可搜索的电子文档,便于存储、检索、共享和后续的编辑处理,提高办公效率,减少纸质文件的存放空间。

(2)表格处理:能自动识别表格内容,并将其转换为结构化的数据,方便进行数据的统计、分析和汇总,例如对项目报告、财务报表中的表格进行识别和数据提取。

2.交通领域

(1)车牌识别:用于识别车牌号码、车牌颜色、车牌类型、车标、车身颜色等车辆特征信息,广泛应用于移动警务、占道停车管理、停车场管理、高速公路收费、交通监控与执法等场景,实现车辆的快速识别和管理,提高交通管理的效率和准确性。

(2)驾驶证、行驶证识别:在交通执法、车辆保险理赔、二手车交易等场景中,可快速提取驾驶证和行驶证上的关键信息,如证件号码、姓名、准驾车型、有效期等,节省人工录入的时间和成本,同时降低错误率。

三、如何用PHP实现OCR文字识别接口调用?

下面以阿里云为例,通过PHP实现接口调用:

<?php$host = "https://kzwordocr.market.alicloudapi.com";$path = "/api-mall/api/general/ocr";$method = "POST";$appcode = "你自己的AppCode";$headers = array();array_push($headers, "Authorization:APPCODE " . $appcode);//根据API的要求,定义相对应的Content-Typearray_push($headers, "Content-Type".":"."application/x-www-form-urlencoded; charset=UTF-8");$querys = "";$bodys = "image=image&url=url";$url = $host . $path;$curl = curl_init();curl_setopt($curl, CURLOPT_CUSTOMREQUEST, $method);curl_setopt($curl, CURLOPT_URL, $url);curl_setopt($curl, CURLOPT_HTTPHEADER, $headers);curl_setopt($curl, CURLOPT_FAILONERROR, false);curl_setopt($curl, CURLOPT_RETURNTRANSFER, true);curl_setopt($curl, CURLOPT_HEADER, true);if (1 == strpos("$".$host, "https://")){curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false);curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, false);}curl_setopt($curl, CURLOPT_POSTFIELDS, $bodys);var_dump(curl_exec($curl));
?>

正确返回示例代码如下:

{"msg": "成功","success": true,"code": 200,"data": {"orderNo": "202407102026336827870","info": [{"line_no": 0, //文本行编号,按从左至右、从上至下顺序依次排列"confidence": 0.96655273, //行文本识别置信度 0-1 "line_content": "姓名", //识别出的文本行内容"line_position": {"x": 53,"width": 53,"y": 66,"line_direction": 0,"height": 22}},{"line_no": 1,"confidence": 0.98909503,"line_content": "陈海江","line_position": {"x": 102,"width": 63,"y": 63,"line_direction": 0,"height": 23}}]}
}line_no		文本行编号,按从左至右、从上至下顺序依次排列
line_content	识别出的文本行内容
confidence	行文本识别置信度
line_position	文本行位置信息,表示为坐标和旋转角度(左上角X,左上角Y,宽Width,高Height,旋转角度Line Position)+x左上角顶点横坐标X +y	左上角顶点纵坐标Y
width	        矩形框的宽
height		矩形框的高
line_direction	文本行的旋转角度
words		文本行内单字符的内容数组,数组元素为一个Json结构,包含character和confidence
character	候选字符character
confidence	单字符的识别置信度

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 【计算机三级-数据库技术】数据库及数据库对象
  • 运营商三要素-手机三要素-运营商三要素验证-运营商实名认证-手机三要素实名校验核验接口API
  • 使用IO流复制文件夹
  • 关于武汉芯景科技有限公司的RS232通信接口芯片XJ3243EEUI开发指南(兼容MAX3243EEUI)
  • 不用再找了,国内无限制使用GPT 4o的方法【2024年9月 亲测好用】
  • AT372-6P单频高精度定位模块功能解读
  • 用Python探索排序算法:冒泡排序的实现与优化
  • NSSCTF练习记录:[SWPUCTF 2021 新生赛]crypto10
  • 精益思维赋能机器人行业的三大维度
  • LLM大模型GPT4o
  • 牛客网SQL进阶144:每月及截止当月的答题情况
  • 论“多快好省”
  • 第12章 网络 (3)
  • python环境训练推理问题服务代码运行异常(error: this module is not meant to work on windows)
  • CF1945H GCD is Greater
  • 【399天】跃迁之路——程序员高效学习方法论探索系列(实验阶段156-2018.03.11)...
  • Flannel解读
  • Git初体验
  • JS题目及答案整理
  • leetcode讲解--894. All Possible Full Binary Trees
  • MobX
  • Next.js之基础概念(二)
  • node.js
  • Promise初体验
  • Python_OOP
  • ⭐ Unity 开发bug —— 打包后shader失效或者bug (我这里用Shader做两张图片的合并发现了问题)
  • 欢迎参加第二届中国游戏开发者大会
  • 利用jquery编写加法运算验证码
  • 排序算法之--选择排序
  • 使用 QuickBI 搭建酷炫可视化分析
  • 使用 Xcode 的 Target 区分开发和生产环境
  • 算法-图和图算法
  • 一、python与pycharm的安装
  • 用Visual Studio开发以太坊智能合约
  • 转载:[译] 内容加速黑科技趣谈
  • 自动记录MySQL慢查询快照脚本
  • 1.Ext JS 建立web开发工程
  • ​​​【收录 Hello 算法】9.4 小结
  • ​14:00面试,14:06就出来了,问的问题有点变态。。。
  • ​Python 3 新特性:类型注解
  • #QT(QCharts绘制曲线)
  • #我与Java虚拟机的故事#连载07:我放弃了对JVM的进一步学习
  • $.ajax()方法详解
  • (1)Map集合 (2)异常机制 (3)File类 (4)I/O流
  • (1/2) 为了理解 UWP 的启动流程,我从零开始创建了一个 UWP 程序
  • (2)MFC+openGL单文档框架glFrame
  • (ZT) 理解系统底层的概念是多么重要(by趋势科技邹飞)
  • (八)五种元启发算法(DBO、LO、SWO、COA、LSO、KOA、GRO)求解无人机路径规划MATLAB
  • (备忘)Java Map 遍历
  • (笔试题)分解质因式
  • (论文阅读31/100)Stacked hourglass networks for human pose estimation
  • (论文阅读笔记)Network planning with deep reinforcement learning
  • (一)硬件制作--从零开始自制linux掌上电脑(F1C200S) <嵌入式项目>
  • (转)创业家杂志:UCWEB天使第一步
  • .【机器学习】隐马尔可夫模型(Hidden Markov Model,HMM)