点击返回网站首页

OCR 自定义模板识别(支持表格识别)

文字识别(OCR)目前在多个行业中得到了广泛应用,比如金融行业的单据识别输入,餐饮行业中的发票识别,
交通领域的车票识别,企业中各种表单识别,以及日常工作生活中常用的身份证,驾驶证,护照识别等等。
OCR(文字识别)是目前常用的一种AI能力。
一般OCR的识别结果是一种按行识别的结构化输出,能够给出一行文字的检测框坐标及文字内容。
但是我们更想要的是带有字段定义的结构化输出,由于表单还活着卡证的多样性,全都预定义好是不现实的。
所以,设计了自定义模板的功能,能够让人设置参照锚点(通过锚点匹配定位,图片透视变换对齐),以及内容识别区
来得到key-value形式的结构化数据。

当前版本包含了下面功能:

  1. 模板自定义
  2. 基于模板识别(支持旋转、倾斜的图片)
  3. 自由文本识别(支持旋转、倾斜的图片)
  4. 表格文本识别(图片需是剪切好的单表格图片)
  5. 表格自动检测文本识别(支持表格文字混编,自动检测表格识别文字,支持多表格)

1. 自定义模板 - 参照锚点设置

Screenshot

2. 自定义模板 - 内容识别区设置

Screenshot

3. 基于模板文字识别

Screenshot

4. 通用文本识别

Screenshot

5. 表格文字识别

Screenshot

项目源码的使用说明

    1. 提供完整的java语言实现的项目源代码(含模型文件),如果是web应用,前端VUE,后端SpringBoot
    1. 可用于自我学习目的,其它帮助信息参考:http://aias.top/guides.html
    1. 可用于项目中,在现有的代码上定制开发,减少从零开始的摸索时间。