文字识别(OCR)工具箱
文字识别(OCR)目前在多个行业中得到了广泛应用,比如金融行业的单据识别输入,餐饮行业中的发票识别,
交通领域的车票识别,企业中各种表单识别,以及日常工作生活中常用的身份证,驾驶证,护照识别等等。
OCR(文字识别)是目前常用的一种AI能力。
OCR工具箱功能:
- 方向检测
- 图片旋转
- 文字识别(提供三个模型)
- 版面分析(支持5个类别, 用于配合文字识别,表格识别的流水线处理)
- 表格识别
运行OCR识别例子
1.1 文字方向检测:
1.2 文字方向检测帮助类(增加置信度信息显示,便于调试):
2. 图片旋转:
每调用一次rotateImg方法,会使图片逆时针旋转90度。
3. 文字识别:
再使用本方法前,请调用上述方法使图片文字呈水平(0度)方向。
4. 版面分析:
- 运行成功后,命令行应该看到下面的信息:
- 输出图片效果如下:
5. 表格识别:
SDK源代码下载地址:
Github链接
Gitee链接