文字图片识别 sdk_框选参照字段-华为云

框选参照字段

框选参照字段在文字识别过程中，套件会检查所识别图片与模板图片是否为同一种模板，并将识别图片校正后再提取结构化信息，支持图片平移、旋转与拉伸变换。为了检查并校正待识别的图片，这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板，通过参照字段的位置来校正待识别图片。

来自：帮助中心

查看更多 →
上传模板图片

上传模板图片在使用单模板工作流开发应用之前，必须要明确文字识别的模板类型，明确以哪张图片作为模板训练文字识别模型，基于自己的业务需求制定针对性的文字识别模型。例如上传某一格式的发票图片作为模板，训练的文字识别模型就能识别并提取同格式发票上的关键字段。前提条件已授权ModelArts服务和对象存储服务（OBS）。

来自：帮助中心

查看更多 →
电子面单识别

the requirements." } SDK代码示例 SDK代码示例如下。使用SDK前建议将SDK更新至最新版，防止本地旧版SDK无法使用最新的OCR功能。 Java Python Go 更多传入快递单图片的base64编码进行文字识别 1 2 3 4 5 6 7

来自：帮助中心

查看更多 →
工作流介绍

详细指导上传模板图片在使用多模板工作流开发应用之前，需要上传模板图片，明确以哪些图片作为模板训练文字识别模型。上传模板图片定义预处理上传模板图片后，需要对模板图片进行预处理，去掉冗余部分，将图片旋转至水平，保证模型识别的准确性。定义预处理框选参照字段在图片模板中框选参照

来自：帮助中心

查看更多 →
框选识别区

框选识别区在文字识别过程中，需要确定图片中识别的文字位置，这就需要在图片模板中框选识别区。识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段，且位置固定不变，因此模型可以通过识别区找到需要识别内容的位置。前提条件已在自定义OCR控制台选择“通用单模

来自：帮助中心

查看更多 →
上传模板图片

上传模板图片在使用多模板分类工作流开发应用之前，必须要明确文字识别的模板类型，明确以哪几种板式图片作为模板训练文字识别模型，基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板，训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。前提条件

来自：帮助中心

查看更多 →
框选参照字段

框选参照字段在文字识别过程中，套件会检查所识别图片与模板图片是否为同一种模板，并将识别图片校正后再提取结构化信息，支持图片平移、旋转与拉伸变换。为了检查并校正待识别的图片，这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板，通过参照字段的位置来校正待识别图片。

来自：帮助中心

查看更多 →
评估

上传测试图片或者上传在线图片，评估模板。图4 评估模板本地上传图片默认进入“本地上传”页签，单击“上传图片”，或者拖拽测试图片至虚线框内上传图片区域，上传本地的图片作为测试图片。上传图片后，右侧会显示文字识别结果，包括“识别区”和对应的“识别结果”。上传在线图片单击“

来自：帮助中心

查看更多 →
解读识别结果

了图片中的文字块数目、文字块排列顺序、具体文本内容、所在位置、置信度等信息。 result字段仅在API调用成功后返回。 words_block_count表示文字块识别结果，本示例中，识别出2个文字块，分别代表图片中的2行文字。 words_block_list表示文字块列表，按照图片文字从上到下、从左到右排列。

来自：帮助中心

查看更多 →
泰国车牌识别

the requirements." } SDK代码示例 SDK代码示例如下。使用SDK前建议将SDK更新至最新版，防止本地旧版SDK无法使用最新的OCR功能。 Java Python Go 更多传入泰国车牌图片的base64编码进行文字识别 1 2 3 4 5 6

来自：帮助中心

查看更多 →
自定义模板OCR

requirements." } SDK代码示例 SDK代码示例如下。使用SDK前建议将SDK更新至最新版，防止本地旧版SDK无法使用最新的OCR功能。 Java Python Go 更多传入自定义模板OCR 的图片的base64编码进行文字识别 1 2 3 4 5 6

来自：帮助中心

查看更多 →
在线调试

DE，可完成代码的构建、调试、运行。本章节以通用文字识别为例，介绍如何使用 API Explorer 调试API。前提条件注册华为账号并开通华为云，并完成实名认证，账号不能处于欠费、冻结、被注销等异常状态。已开通通用文字识别。操作步骤登录API Explorer。登录后

来自：帮助中心

查看更多 →
上传模板图片

上传模板图片在使用多模板分类工作流开发应用之前，必须要明确文字识别的模板类型，明确以哪几种板式图片作为模板训练文字识别模型，基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板，训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。前提条件

来自：帮助中心

查看更多 →
保险单识别

保险单识别功能介绍识别保险单图片上的文字信息，并将识别的结构化结果返回给用户。支持对多板式保险单的扫描图片及手机照片进行结构化信息提取。约束与限制只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。图像各边的像素在15px到8192px之间。图像中保险单区域

来自：帮助中心

查看更多 →
泰文身份证识别

requirements." } SDK代码示例 SDK代码示例如下。使用SDK前建议将SDK更新至最新版，防止本地旧版SDK无法使用最新的OCR功能。 Java Python Go 更多传入泰文身份证图片的base64编码进行文字识别 1 2 3 4 5 6

来自：帮助中心

查看更多 →
飞机行程单识别

requirements." } SDK代码示例 SDK代码示例如下。使用SDK前建议将SDK更新至最新版，防止本地旧版SDK无法使用最新的OCR功能。 Java Python Go 更多传入飞机行程单图片的base64编码进行文字识别 1 2 3 4 5 6

来自：帮助中心

查看更多 →
承兑汇票识别

the requirements." } SDK代码示例 SDK代码示例如下。使用SDK前建议将SDK更新至最新版，防止本地旧版SDK无法使用最新的OCR功能。 Java Python Go 更多传入承兑汇票图片的base64编码进行文字识别 1 2 3 4 5 6

来自：帮助中心

查看更多 →
文字水印

文字水印添加文字水印时使用的参数，包括字体大小、字体类型以及文字颜色等。具体文字水印参数如表1所示。表1 文字水印参数参数取值说明代码样例 text 添加文字水印时的必选参数。须知：必须是URL安全base64编码。encodeText = url_safe_bas

来自：帮助中心

查看更多 →
自定义OCR介绍

自定义OCR基于丰富的文字识别算法和行业知识积累，帮助客户快速构建满足不同业务场景需求的文字识别服务，实现多种版式图像的文字信息结构化提取。工作流自定义OCR当前提供了单模板工作流和多模板工作流，自主构建文字识别模板，识别模板图片中的文字，提供高精度的文字识别模型，保证结构化信息提取精度。

来自：帮助中心

查看更多 →
框选参照字段

框选参照字段在文字识别过程中，套件会检查所识别图片与模板图片是否为同一种模板，并将识别图片校正后再提取结构化信息，支持图片平移、旋转与拉伸变换。为了检查并校正待识别的图片，这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板，通过参照字段的位置来校正待识别图片。

来自：帮助中心

查看更多 →
约束与限制

能处理反光、暗光等干扰的图片但影响识别精度。目前支持识别单张身份证的正面或者反面。支持居民身份证的正反面同时识别，不支持存在两张及以上同面身份证的图片识别。文字识别服务属于公有云服务，线上用户资源共享，如果需要多并发请求，请提前联系我们。户口本识别只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。

来自：帮助中心

查看更多 →