将图片文字识别为文字的方法

工作流介绍

图片中的结构化信息。框选参照字段框选识别区在图片模板中框选识别区，确定模板图片中需要识别的文字位置。框选识别区评估通过上传与模板图片同一板式的测试图片，评估图片识别结果是否正确。评估调用指南生成模板ID和自定义文字识别接口，用于识别自己所上传的模板样式的图片。提

来自：帮助中心

查看更多 →
使用流程简介

OCR服务需要用户通过调用API接口，将图片或扫描件中的文字识别成可编辑的文本，然后返回JSON格式的识别结果，用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。关于文字识别的相关声明请参见文字识别服务声明。文字识别服务等级协议请参见华为云服务等级协议。

来自：帮助中心

查看更多 →
概述

概述文字识别（Optical Character Recognition，简称OCR）是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式，以JSON格式返回识别结果。 OCR以开放API（Application Programming Interf

来自：帮助中心

查看更多 →
工作流介绍

在图片模板中框选参照字段，用于矫正图片的方向，进而在正确的方向上，识别图片中的结构化信息。对于多模板应用而言，参照字段还将用于区分不同的模板。框选参照字段框选识别区在图片模板中框选识别区，确定模板图片中需要识别的文字位置。框选识别区模板总览检查所有模板是否已正确配置。模板总览评估通

来自：帮助中心

查看更多 →
上传模板图片

上传模板图片在使用多模板分类工作流开发应用之前，必须要明确文字识别的模板类型，明确以哪几种板式图片作为模板训练文字识别模型，基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板，训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。前提条件

来自：帮助中心

查看更多 →
工作流介绍

在正确的方向上，识别图片中的结构化信息。框选参照字段框选识别区在图片模板中框选识别区，确定模板图片中需要识别的文字位置。框选识别区评估应用通过上传与模板图片同一板式的测试图片，评估图片识别结果是否正确。评估应用部署服务模板图片评估后，可以部署模板至文字识别开发套

来自：帮助中心

查看更多 →
附录

Service，OBS）是一个基于对象的海量存储服务，为客户提供海量、安全、高可靠、低成本的数据存储能力。函数工作流 FunctionGraph：FunctionGraph是一项基于事件驱动的函数托管计算服务。使用FunctionGraph函数，只需编写业务函数代码并设置运行的条件，无需配置和管理

来自：帮助中心

查看更多 →
上传模板图片

上传模板图片在使用单模板工作流开发应用之前，必须要明确文字识别的模板类型，明确以哪张图片作为模板训练文字识别模型，基于自己的业务需求制定针对性的文字识别模型。例如上传某一格式的发票图片作为模板，训练的文字识别模型就能识别并提取同格式发票上的关键字段。前提条件已授权ModelArts服务和对象存储服务（OBS）。

来自：帮助中心

查看更多 →
行业套件介绍

板图片中的文字，提供高精度的文字识别模型，保证结构化信息提取精度。通用单模板工作流通过构建文字识别模板，识别单个板式图片中的文字，提供高精度的文字识别模型，保证结构化信息提取精度。多模板分类工作流支持用户自定义多个文字识别模板，通过模型训练，自动识别图片所需使用的模板，从

来自：帮助中心

查看更多 →
自定义OCR介绍

自定义OCR介绍 OCR自定义模板已正式停售，为避免影响您目前的业务，请您及时进行相关迁移工作，迁移指导详见OCR自定义模板停售公告。自定义OCR基于丰富的文字识别算法和行业知识积累，帮助客户快速构建满足不同业务场景需求的文字识别服务，实现多种版式图像的文字信息结构化提取。工作流自定义O

来自：帮助中心

查看更多 →
工作流介绍

通过上传测试图片，在线评估模板分类情况和模板的文字识别情况，保证能在多个模板情况下正确分类测试图片的模板，并且能正确识别测试图片中的识别区文字。评估应用部署服务模板图片评估后，可以部署模板至文字识别开发套件中，开发属于自己的文字识别应用，此应用用于识别自己所上传的多模板样式的图片。

来自：帮助中心

查看更多 →
框选参照字段

框选参照字段在文字识别过程中，套件会检查所识别图片与模板图片是否为同一种模板，并将识别图片校正后再提取结构化信息，支持图片平移、旋转与拉伸变换。为了检查并校正待识别的图片，这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板，通过参照字段的位置来校正待识别图片。

来自：帮助中心

查看更多 →
附录

Service，OBS）是一个基于对象的海量存储服务，为客户提供海量、安全、高可靠、低成本的数据存储能力。函数工作流 FunctionGraph：FunctionGraph是一项基于事件驱动的函数托管计算服务。使用FunctionGraph函数，只需编写业务函数代码并设置运行的条件，无需配置和管理

来自：帮助中心

查看更多 →
如何选购合适的API

如何选购合适的API 文字识别服务（OCR）提供四种类型的API：通用类、证件类、票据类、智能分类。除此之外，您也可以使用 ModelArts Pro 服务提供的“文字识别套件”零代码搭建出专属的文字识别系统。通用类通用表格识别：提取表格内的文字和所在行列位置信息。通用文字识别：提取图片内的文字及其对应位置信息。

来自：帮助中心

查看更多 →
框选参照字段

框选参照字段个数须建议大于4个，越多越好，并尽量分散在图片的四周。参考字段尽量沿着文字边缘框选，精确框住对应文本行为佳。核对右侧“框选参照字段”中的参照字段是否与框选的参照字段一致。框选并核对完所有模板图片的参照字段后，单击“下一步”，进入框选识别区步骤。父主题：多模板分类工作流

来自：帮助中心

查看更多 →
使用单模板工作流开发应用

ModelArts Pro的文字识别套件提供了通用单模板工作流，通过工作流指引可构建文字识别模板，识别单个板式图片中的文字，快速实现文档、票证等场景的文字识别。本章节提供一个身份证样例，帮助您快速熟悉使用文字识别套件中的通用单模板工作流开发应用的过程。通过上传模板图片、框选参照字段和识

来自：帮助中心

查看更多 →
约束与限制

FF格式的图片。图像各边的像素大小在15到8192px之间。支持图像中不动产证任意角度的水平旋转。能处理反光、暗光等干扰的图片但影响识别精度。车辆合格证只支持中国大陆车辆合格证的识别。只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。图像各边的像素大小在15到8192px之间。

来自：帮助中心

查看更多 →
OCR服务使用简介

OCR服务使用简介文字识别（Optical Character Recognition，简称OCR）指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式。 OCR以开放API（Application Programming Interface，应用程序

来自：帮助中心

查看更多 →
图片质量类报错处理办法

图片质量类报错处理办法问题现象调用文字识别API时，产生以下图片质量类报错。错误码AIS.0102：图片格式不支持。错误码AIS.0103：图片尺寸不满足要求。错误码AIS.0104：非支持的图片类型或图片质量差。解决方法请参考产品介绍 > 约束与限制章节检查图片的格式、像素是否符合规范。

来自：帮助中心

查看更多 →
方案概述

络图片识别构建，并通过对象存储服务 OBS进行图片的上传以及识别结果的存放。该解决方案部署架构如下图所示：图1 方案架构该解决方案会部署如下资源：创建两个对象存储服务 OBS桶，一个用于存放用户上传的收/寄件信息图片、电子面单图片，当用户上传后，自动通知函数工作流进行处理，

来自：帮助中心

查看更多 →
提取图片中的文字暗水印（文件地址版本）

提取图片中的文字暗水印（文件地址版本）功能介绍对指定存储地址信息（目前支持OBS）的已嵌入文字暗水印的图片提取文字暗水印，支持的图片格式为：*.jpg, *.jpeg, *.jpe, *.png, *.bmp, *.dib, *.rle, *.tiff, *.tif, *.ppm

来自：帮助中心

查看更多 →