当前位置: 首页 > news >正文

创造一个表格编辑距离指标

这个是我自研的, 与百度PaddleOCR的方式略有不同。

数据的格式:
相当于一个目标检测有两类,分别是table和cell。

在预测值和标签中要先把根据位置关系所有的cell划分到不同的table中。

另外cell标签中还有起止位置

比如

 四个数字代表行和列,0 0 0 0 代表从第0行到第0行,从第0列到第0列

我们的标签和预测值的cell都是排序好的

顺序是这样排的

 与字符的编辑距离类似,可以把一个cell当作一个字符,

一个table相当于这样的格式

【0 0 0 0】【0 0 1 3】【1 1 0 0】【1 1 1 3】……

删除一个cell,需要的操作数为该cell的跨行列之和,插入一个cell也类似。

替换一个cell的操作数包括两部分,一部分是cell大小操作数,另一部分是位置操作数。

    cell大小的操作数是二者跨行列之和的差值,

    cell的位置操作数是 二者行位置操作数和列位置操作数之和。

       行位置操作数,先计算行起点差值与终点差值,两个差值的的最小值。

       列位置操作数同理。

 

相关文章:

  • 大数据Hadoop之——Apache Hudi 数据湖实战操作(FlinkCDC)
  • ikun网站成名录: HTML 中的常用标签用法,从0到1创建一个ikun简介
  • <Linux系统复习>文件描述符
  • 【C++入门】(纯)虚函数和多态、抽象类、接口
  • 推荐一个C#开发的窗口扩展菜单,支持系统所以窗口
  • 初识深度学习-吴恩达
  • Rust Tauri OpenCV 写一个桌面摄像头
  • 在python中使用ggplot2
  • 基于 Vue 和 SpringBoot 实现的博客系统(附源码)
  • 【MySQL高级篇】数据库到底是什么?一文带你快速上手MySQL
  • Python所有的库都在这里了!!强烈建议收藏
  • 一文彻底搞懂Mybatis系列(十二)之MyBatis多对一映射延迟加载(association和lazyLoadingEnabled)
  • 贝叶斯推理三种方法:MCMC 、HMC和SBI
  • 嵌入式串口转CAN模块详细参数分析
  • 计算机网络--数据链路层
  • @angular/forms 源码解析之双向绑定
  • 《微软的软件测试之道》成书始末、出版宣告、补充致谢名单及相关信息
  • 2017-08-04 前端日报
  • 2017前端实习生面试总结
  • Java 11 发布计划来了,已确定 3个 新特性!!
  • Java读取Properties文件的六种方法
  • Laravel Telescope:优雅的应用调试工具
  • MaxCompute访问TableStore(OTS) 数据
  • PAT A1120
  • python学习笔记 - ThreadLocal
  • QQ浏览器x5内核的兼容性问题
  • rc-form之最单纯情况
  • vue自定义指令实现v-tap插件
  • 翻译 | 老司机带你秒懂内存管理 - 第一部(共三部)
  • 仿天猫超市收藏抛物线动画工具库
  • 关于extract.autodesk.io的一些说明
  • 如何进阶一名有竞争力的程序员?
  • 【云吞铺子】性能抖动剖析(二)
  • PostgreSQL 快速给指定表每个字段创建索引 - 1
  • ​MySQL主从复制一致性检测
  • ​中南建设2022年半年报“韧”字当头,经营性现金流持续为正​
  • !!【OpenCV学习】计算两幅图像的重叠区域
  • #、%和$符号在OGNL表达式中经常出现
  • #LLM入门|Prompt#3.3_存储_Memory
  • ()、[]、{}、(())、[[]]命令替换
  • (1) caustics\
  • (9)目标检测_SSD的原理
  • (博弈 sg入门)kiki's game -- hdu -- 2147
  • (多级缓存)缓存同步
  • (蓝桥杯每日一题)平方末尾及补充(常用的字符串函数功能)
  • (一)eclipse Dynamic web project 工程目录以及文件路径问题
  • (转)jdk与jre的区别
  • (轉貼)《OOD启思录》:61条面向对象设计的经验原则 (OO)
  • . Flume面试题
  • .Family_物联网
  • .NET 2.0中新增的一些TryGet,TryParse等方法
  • .net6Api后台+uniapp导出Excel
  • .NET国产化改造探索(一)、VMware安装银河麒麟
  • .net和php怎么连接,php和apache之间如何连接
  • .Net通用分页类(存储过程分页版,可以选择页码的显示样式,且有中英选择)