点击返回网站首页

 

文字识别(OCR)工具箱

文字识别(OCR)目前在多个行业中得到了广泛应用,比如金融行业的单据识别输入,餐饮行业中的发票识别, 交通领域的车票识别,企业中各种表单识别,以及日常工作生活中常用的身份证,驾驶证,护照识别等等。 OCR(文字识别)是目前常用的一种AI能力。

OCR工具箱功能:

  1. 方向检测
  1. 图片旋转
  2. 文字识别(提供三个模型)
  1. 版面分析(支持5个类别, 用于配合文字识别,表格识别的流水线处理)
  1. 表格识别

运行OCR识别例子

1.1 文字方向检测:

1.2 文字方向检测帮助类(增加置信度信息显示,便于调试):

2. 图片旋转:

每调用一次rotateImg方法,会使图片逆时针旋转90度。

3. 文字识别:

再使用本方法前,请调用上述方法使图片文字呈水平(0度)方向。

 

4. 版面分析:

5. 表格识别:

 

 

SDK源代码下载地址:

Github链接
Gitee链接

点击返回网站首页