点击返回网站首页

 

OCR 自定义模板识别(支持表格识别)

文字识别(OCR)目前在多个行业中得到了广泛应用,比如金融行业的单据识别输入,餐饮行业中的发票识别,交通领域的车票识别,企业中各种表单识别,以及日常工作生活中常用的身份证,驾驶证,护照识别等等。OCR(文字识别)是目前常用的一种AI能力。一般OCR的识别结果是一种按行识别的结构化输出,能够给出一行文字的检测框坐标及文字内容。但是我们更想要的是带有字段定义的结构化输出,由于表单还活着卡证的多样性,全都预定义好是不现实的。 所以,设计了自定义模板的功能,能够让人设置参照锚点(通过锚点匹配定位,图片透视变换对齐),以及内容识别区来得到key-value形式的结构化数据。

当前精简试用版(无数据库,redis等)包含了下面功能:

  1. 模板自定义
  2. 基于模板识别
  3. 自由文本识别
  4. 表格文本识别(图片需是剪切好的单表格图片)
  5. 表格自动检测文本识别(支持表格文字混编,自动检测表格识别文字,支持多表格) (需要图片都是摆正的,即没有旋转角度。)

功能介绍

打开浏览器

输入地址: http://localhost:8080

标注模板

基于模板文字识别

通用文本识别

表格文字识别 / 表格自动检测文字识别

项目源代码下载:

Github链接

Gitee链接

 

点击返回网站首页