ocr_sdk
点击返回网站首页

文字识别(OCR)工具箱

文字识别(OCR)目前在多个行业中得到了广泛应用,比如金融行业的单据识别输入,餐饮行业中的发票识别,
交通领域的车票识别,企业中各种表单识别,以及日常工作生活中常用的身份证,驾驶证,护照识别等等。
OCR(文字识别)是目前常用的一种AI能力。

OCR工具箱功能:

  1. 方向检测
  • 0度
  • 90度
  • 180度
  • 270度
  1. 图片旋转

  2. 文字识别(提供三个模型)

  • mobile模型
  • light模型
  • 服务器端模型
  1. 版面分析(支持5个类别, 用于配合文字识别,表格识别的流水线处理)
  • Text
  • Title
  • List
  • Table
  • Figure
  1. 表格识别
  • 生成html表格
  • 生成excel文件

运行OCR识别例子

1.1 文字方向检测:

  • 输出图片效果如下:

1.2 文字方向检测帮助类(增加置信度信息显示,便于调试):

  • 输出图片效果如下:

2. 图片旋转:

每调用一次rotateImg方法,会使图片逆时针旋转90度。

  • 旋转前图片:
  • 旋转后图片效果如下:

3. 文字识别:

再使用本方法前,请调用上述方法使图片文字呈水平(0度)方向。

  • 输出图片效果如下:

4. 版面分析:

  • 运行成功后,命令行应该看到下面的信息:
  • 输出图片效果如下:

5. 表格识别:

  • 输出图片效果如下:
  • 生成excel效果如下:

SDK源代码下载地址:

Gitee链接

点击返回网站首页