OCR文字识别接口如何用PHP进行调用
一、什么是OCR文字识别接口?
OCR文字识别接口,是指将图像中文字内容进行识别,例如可以识别照片中的文字信息,方便对文档、书籍、名片等各种载体上的文字进行数字化处理。
二、OCR文字识别接口适用于哪些场景?
例如:
1.办公自动化领域:
(1)文档转换和数字化:可将纸质文档、书籍、报纸、合同、简历等大量纸质文件快速转换成可编辑和可搜索的电子文档,便于存储、检索、共享和后续的编辑处理,提高办公效率,减少纸质文件的存放空间。
(2)表格处理:能自动识别表格内容,并将其转换为结构化的数据,方便进行数据的统计、分析和汇总,例如对项目报告、财务报表中的表格进行识别和数据提取。
2.交通领域:
(1)车牌识别:用于识别车牌号码、车牌颜色、车牌类型、车标、车身颜色等车辆特征信息,广泛应用于移动警务、占道停车管理、停车场管理、高速公路收费、交通监控与执法等场景,实现车辆的快速识别和管理,提高交通管理的效率和准确性。
(2)驾驶证、行驶证识别:在交通执法、车辆保险理赔、二手车交易等场景中,可快速提取驾驶证和行驶证上的关键信息,如证件号码、姓名、准驾车型、有效期等,节省人工录入的时间和成本,同时降低错误率。
三、如何用PHP实现OCR文字识别接口调用?
下面以阿里云为例,通过PHP实现接口调用:
<?php$host = "https://kzwordocr.market.alicloudapi.com";$path = "/api-mall/api/general/ocr";$method = "POST";$appcode = "你自己的AppCode";$headers = array();array_push($headers, "Authorization:APPCODE " . $appcode);//根据API的要求,定义相对应的Content-Typearray_push($headers, "Content-Type".":"."application/x-www-form-urlencoded; charset=UTF-8");$querys = "";$bodys = "image=image&url=url";$url = $host . $path;$curl = curl_init();curl_setopt($curl, CURLOPT_CUSTOMREQUEST, $method);curl_setopt($curl, CURLOPT_URL, $url);curl_setopt($curl, CURLOPT_HTTPHEADER, $headers);curl_setopt($curl, CURLOPT_FAILONERROR, false);curl_setopt($curl, CURLOPT_RETURNTRANSFER, true);curl_setopt($curl, CURLOPT_HEADER, true);if (1 == strpos("$".$host, "https://")){curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false);curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, false);}curl_setopt($curl, CURLOPT_POSTFIELDS, $bodys);var_dump(curl_exec($curl));
?>
正确返回示例代码如下:
{"msg": "成功","success": true,"code": 200,"data": {"orderNo": "202407102026336827870","info": [{"line_no": 0, //文本行编号,按从左至右、从上至下顺序依次排列"confidence": 0.96655273, //行文本识别置信度 0-1 "line_content": "姓名", //识别出的文本行内容"line_position": {"x": 53,"width": 53,"y": 66,"line_direction": 0,"height": 22}},{"line_no": 1,"confidence": 0.98909503,"line_content": "陈海江","line_position": {"x": 102,"width": 63,"y": 63,"line_direction": 0,"height": 23}}]}
}line_no 文本行编号,按从左至右、从上至下顺序依次排列
line_content 识别出的文本行内容
confidence 行文本识别置信度
line_position 文本行位置信息,表示为坐标和旋转角度(左上角X,左上角Y,宽Width,高Height,旋转角度Line Position)+x左上角顶点横坐标X +y 左上角顶点纵坐标Y
width 矩形框的宽
height 矩形框的高
line_direction 文本行的旋转角度
words 文本行内单字符的内容数组,数组元素为一个Json结构,包含character和confidence
character 候选字符character
confidence 单字符的识别置信度