图片识别文字 java开源6_通用表格识别-华为云

通用表格识别

b64decode解码并保存为.xlsx文件。表6 WordsRegionList 参数参数类型描述 type String 文字识别区域类型。 text：文本识别区域; table：表格识别区域。 words_block_count Integer 子区域识别文字块数目。 words_block_list

来自：帮助中心

查看更多 →
上传模板图片

上传模板图片在使用多模板分类工作流开发应用之前，必须要明确文字识别的模板类型，明确以哪几种板式图片作为模板训练文字识别模型，基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板，训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。前提条件

来自：帮助中心

查看更多 →
框选参照字段

框选参照字段在文字识别过程中，套件会检查所识别图片与模板图片是否为同一种模板，并将识别图片校正后再提取结构化信息，支持图片平移、旋转与拉伸变换。为了检查并校正待识别的图片，这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板，通过参照字段的位置来校正待识别图片。

来自：帮助中心

查看更多 →
框选识别区

框选识别区在文字识别过程中，需要确定图片中识别的文字位置，这就需要在图片模板中框选识别区。识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段，且位置固定不变，因此模型可以通过识别区找到需要识别内容的位置。前提条件已在自定义OCR控制台选择“通用单模

来自：帮助中心

查看更多 →
什么情况下可以使用自定义模板？

业证上的文字信息。自定义模板支持识别单模板应用或是多模板应用，单模板仅支持一种版式，多模板支持识别多种版式。单模板的前提：识别图片需与模板图片版式相同，具体而言，图片中要存在文字内容和位置均固定不变的文字（参照字段）。识别文字内容不能偏离设定的识别区域，包括打印偏移、由上下文长度变化引起的偏移等。

来自：帮助中心

查看更多 →
智能文档解析

使用SDK前建议将SDK更新至最新版，防止本地旧版SDK无法使用最新的OCR功能。 Java Python Go 更多传入文档图片的base64编码进行文字识别 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

来自：帮助中心

查看更多 →
框选参照字段

框选参照字段在文字识别过程中，套件会检查所识别图片与模板图片是否为同一种模板，并将识别图片校正后再提取结构化信息，支持图片平移、旋转与拉伸变换。为了检查并校正待识别的图片，这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板，通过参照字段的位置来校正待识别图片。

来自：帮助中心

查看更多 →
自定义OCR介绍

自定义OCR基于丰富的文字识别算法和行业知识积累，帮助客户快速构建满足不同业务场景需求的文字识别服务，实现多种版式图像的文字信息结构化提取。工作流自定义OCR当前提供了单模板工作流和多模板工作流，自主构建文字识别模板，识别模板图片中的文字，提供高精度的文字识别模型，保证结构化信息提取精度。

来自：帮助中心

查看更多 →
上传模板图片

需要定制识别的字段。例如上传某一格式的发票图片作为模板，配置文字识别模型就能识别并提取同格式发票上的关键字段。前提条件已在“自定义OCR”控制台选择“通用单模板工作流”创建应用，详情请见6.2新建应用。提前准备待识别的图片，图片要求请见图片要求。图片要求保证图片质量：不

来自：帮助中心

查看更多 →
约束与限制

能处理反光、暗光等干扰的图片但影响识别精度。目前支持识别单张身份证的正面或者反面。支持居民身份证的正反面同时识别，不支持存在两张及以上同面身份证的图片识别。文字识别服务属于公有云服务，线上用户资源共享，如果需要多并发请求，请提前联系我们。户口本识别只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。

来自：帮助中心

查看更多 →
框选参照字段

框选参照字段在识别文字的过程中，套件会先对图片进行模板分类，再检查所识别图片与模板图片是否为同一种模板，并将识别图片校正后再提取结构化信息，支持图片平移、旋转与拉伸变换。为了正确分类并校正待识别的图片，这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断识别图片属于哪一种

来自：帮助中心

查看更多 →
评估应用

评估应用确定模板图片的参照字段和识别区后，需要对模板图片进行评估和考察。您可以通过上传测试图片，在线评估模板的识别情况，保证能正确识别同样模板下其他图片中的识别区文字。前提条件已在文字识别套件控制台选择“通用单模板工作流”新建应用，并完成框选识别区步骤，详情请见框选识别区。进入评估页面

来自：帮助中心

查看更多 →
行业套件介绍

行业套件介绍文字识别套件基于丰富的文字识别算法和行业知识积累，帮助客户快速构建满足不同业务场景需求的文字识别服务，实现多种版式图像的文字信息结构化提取。文字识别套件的介绍请参见产品介绍。预置工作流文字识别套件当前提供了单模板工作流和多模板工作流，自主构建文字识别模板，识别模板图片

来自：帮助中心

查看更多 →
银行卡识别

使用SDK前建议将SDK更新至最新版，防止本地旧版SDK无法使用最新的OCR功能。 Java Python Go 更多传入银行卡图片的base64编码进行文字识别 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

来自：帮助中心

查看更多 →
财务报表识别

使用SDK前建议将SDK更新至最新版，防止本地旧版SDK无法使用最新的OCR功能。 Java Python Go 更多传入财务报表图片的base64编码进行文字识别 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

来自：帮助中心

查看更多 →
准备数据

受技术与成本多种因素制约，文字识别服务存在一些约束限制。以通用文字识别API为例，输入数据存在以下约束。其他API的的使用约束请参见约束与限制。只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。图像各边的像素大小在15px到8192px之间。图像中识别区域有效占比超过

来自：帮助中心

查看更多 →
行驶证识别

使用SDK前建议将SDK更新至最新版，防止本地旧版SDK无法使用最新的OCR功能。 Java Python Go 更多传入行驶证主页图片的base64编码进行文字识别，并识别发证机关信息 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

来自：帮助中心

查看更多 →
框选识别区

框选识别区在文字识别过程中，需要确定图片中识别的文字位置，这就需要在图片模板中框选识别区。识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段，且位置固定不变，因此模型可以通过识别区找到需要识别内容的位置。前提条件已在文字识别套件控制台选择“多模板分

来自：帮助中心

查看更多 →
如何提高识别精度

如何提高识别精度尽量使用文字清晰度高、无反光的图片。进行图片采集时，尽量提高待识别文字区域占比，减少无关背景占比，保持图片内文字清晰人眼可辨认。若图片有旋转角度，算法支持自动修正，建议图片不要过度倾斜。图片尺寸方面，建议最长边不超过8192像素，最短边不小于15像素，图像长宽比例维持常见水平

来自：帮助中心

查看更多 →
VIN码识别

使用SDK前建议将SDK更新至最新版，防止本地旧版SDK无法使用最新的OCR功能。 Java Python Go 更多传入车架号VIN码图片的base64编码进行文字识别 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

来自：帮助中心

查看更多 →
印章识别

使用SDK前建议将SDK更新至最新版，防止本地旧版SDK无法使用最新的OCR功能。 Java Python Go 更多传入印章图片的base64编码进行文字识别 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

来自：帮助中心

查看更多 →