ocr_sdk

　　 ocr_sdk

点击返回网站首页

文字识别（OCR）工具箱

文字识别（OCR）目前在多个行业中得到了广泛应用，比如金融行业的单据识别输入，餐饮行业中的发票识别，
交通领域的车票识别，企业中各种表单识别，以及日常工作生活中常用的身份证，驾驶证，护照识别等等。
OCR（文字识别）是目前常用的一种AI能力。

OCR工具箱功能:

方向检测

0度
90度
180度
270度

图片旋转
文字识别(提供三个模型)

mobile模型
light模型
服务器端模型

版面分析（支持5个类别, 用于配合文字识别，表格识别的流水线处理）

Text
Title
List
Table
Figure

表格识别

生成html表格
生成excel文件

运行OCR识别例子

1.1 文字方向检测：

输出图片效果如下：

1.2 文字方向检测帮助类（增加置信度信息显示，便于调试）：

输出图片效果如下：

2. 图片旋转：

每调用一次rotateImg方法，会使图片逆时针旋转90度。

旋转前图片:

旋转后图片效果如下：

3. 文字识别：

再使用本方法前，请调用上述方法使图片文字呈水平(0度)方向。

输出图片效果如下：

4. 版面分析：

运行成功后，命令行应该看到下面的信息:
输出图片效果如下：

5. 表格识别：

输出图片效果如下：

生成excel效果如下：

SDK源代码下载地址：

点击返回网站首页