识别图片上文字APP_框选识别区-华为云

框选识别区

框选识别区在文字识别过程中，需要确定图片中识别的文字位置，这就需要在图片模板中框选识别区。识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段，且位置固定不变，因此模型可以通过识别区找到需要识别内容的位置。前提条件已在自定义OCR控制台选择“通用单模

来自：帮助中心

查看更多 →
OCR

类特殊字符，长度为1～128个字符。图片路径是需要识别的图片在OBS上的路径。识别类型是可识别的图片类型, 当前仅支持通用文字识别。可支持扫描文件、电子文档、书籍、票据和表单等多种场景的文字识别。识别结果存储目录是指定识别结果存储的OBS目录。表2 高级参数参数

来自：帮助中心

查看更多 →
使用单模板工作流开发应用

使用单模板工作流开发应用 ModelArts Pro 的文字识别套件提供了通用单模板工作流，通过工作流指引可构建文字识别模板，识别单个板式图片中的文字，快速实现文档、票证等场景的文字识别。本章节提供一个身份证样例，帮助您快速熟悉使用文字识别套件中的通用单模板工作流开发应用的过程。通过上

来自：帮助中心

查看更多 →
框选参照字段

框选参照字段在文字识别过程中，套件会检查所识别图片与模板图片是否为同一种模板，并将识别图片校正后再提取结构化信息，支持图片平移、旋转与拉伸变换。为了检查并校正待识别的图片，这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板，通过参照字段的位置来校正待识别图片。

来自：帮助中心

查看更多 →
框选参照字段

框选参照字段在识别文字的过程中，套件会先对图片进行模板分类，再检查所识别图片与模板图片是否为同一种模板，并将识别图片校正后再提取结构化信息，支持图片平移、旋转与拉伸变换。为了正确分类并校正待识别的图片，这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断识别图片属于哪一种

来自：帮助中心

查看更多 →
框选参照字段

框选参照字段在文字识别过程中，套件会检查所识别图片与模板图片是否为同一种模板，并将识别图片校正后再提取结构化信息，支持图片平移、旋转与拉伸变换。为了检查并校正待识别的图片，这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板，通过参照字段的位置来校正待识别图片。

来自：帮助中心

查看更多 →
框选参照字段

框选参照字段在文字识别过程中，套件会检查所识别图片与模板图片是否为同一种模板，并将识别图片校正后再提取结构化信息，支持图片平移、旋转与拉伸变换。为了检查并校正待识别的图片，这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板，通过参照字段的位置来校正待识别图片。

来自：帮助中心

查看更多 →
行业套件介绍

行业套件介绍文字识别套件基于丰富的文字识别算法和行业知识积累，帮助客户快速构建满足不同业务场景需求的文字识别服务，实现多种版式图像的文字信息结构化提取。文字识别套件的介绍请参见产品介绍。预置工作流文字识别套件当前提供了单模板工作流和多模板工作流，自主构建文字识别模板，识别模板图片

来自：帮助中心

查看更多 →
通用表格识别

y坐标;坐标原点为图片左上角，x轴沿水平方向，y轴沿竖直方向。表8 WordsListIem 参数参数类型描述 words String 文字块识别结果。 confidence Float 字段的平均置信度，置信度越大，表示本次识别的对应字段的可靠性越高，在统计意义上，置信度越大

来自：帮助中心

查看更多 →
票据类

票据类功能介绍增值税发票识别通过对增值税发票图片预处理、表格提取、文字提取、文字识别、结构化信息输出等一系列技术化手段，快速将增值税发票上的文字信息识别出来，用于后续的进一步处理，节省大量的人工录入成本。机动车销售发票识别自动识别机动车销售发票图片内的文本内容，并返回结构化

来自：帮助中心

查看更多 →
证件类

自动识别图片中的车牌信息。名片识别自动识别名片中的信息，识别信息包括姓名、职位头衔、公司、部门、联系方式、地址、邮箱、传真、邮编、公司网址等信息，并将识别结果返回给用户。 VIN码识别自动识别图片上的车架号信息。泰文身份证识别自动识别身份证上的全部信息，一次扫描即可识别身份证号码、姓名、地址等全部信息。

来自：帮助中心

查看更多 →
OCR服务使用简介

OCR服务使用简介文字识别（Optical Character Recognition，简称OCR）指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式。 OCR以开放API（Application Programming Interface，应用程序

来自：帮助中心

查看更多 →
解读识别结果

了图片中的文字块数目、文字块排列顺序、具体文本内容、所在位置、置信度等信息。 result字段仅在API调用成功后返回。 words_block_count表示文字块识别结果，本示例中，识别出2个文字块，分别代表图片中的2行文字。 words_block_list表示文字块列表，按照图片文字从上到下、从左到右排列。

来自：帮助中心

查看更多 →
行驶证识别

code_number String 条码号。 text_location Object 对应所有在原图上识别到的字段位置信息，包含所有文字区域四个顶点的二维坐标（x,y）。采用图像坐标系，坐标原点为图片左上角，x轴沿水平方向，y轴沿竖直方向。 energy_type String 能源类型。

来自：帮助中心

查看更多 →
文字水印

文字水印添加文字水印时使用的参数，包括字体大小、字体类型以及文字颜色等。具体文字水印参数如表1所示。表1 文字水印参数参数取值说明代码样例 text 添加文字水印时的必选参数。须知：必须是URL安全base64编码。encodeText = url_safe_bas

来自：帮助中心

查看更多 →
约束与限制

能处理反光、暗光等干扰的图片但影响识别精度。目前支持识别单张身份证的正面或者反面。支持居民身份证的正反面同时识别，不支持存在两张及以上同面身份证的图片识别。文字识别服务属于公有云服务，线上用户资源共享，如果需要多并发请求，请提前联系我们。户口本识别只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。

来自：帮助中心

查看更多 →
使用多模板工作流开发应用

所有模板都框选完参照字段后，单击右下角的“下一步”。进入“应用开发>框选识别区”页面。步骤6：框选识别区在“应用开发>框选识别区”页面，通过单击左上方操作图标，调整当前模板图片到合适大小。单击框选操作图标，单击待识别文字的左上角，移动鼠标框选识别区，使得矩形框覆盖待识别的文字。识别区是对应字段内容所在区域

来自：帮助中心

查看更多 →
框选识别区

框选识别区在文字识别过程中，需要确定图片中识别的文字位置，这就需要在图片模板中框选识别区。识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段，且位置固定不变，因此模型可以通过识别区找到需要识别内容的位置。前提条件已在文字识别套件控制台选择“多模板分

来自：帮助中心

查看更多 →
银行卡识别

银行卡识别功能介绍识别银行卡上的关键文字信息，并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制，详细使用指导请参见OCR服务使用简介章节。图1 银行卡示例图如果图片中包含多张卡证票据，请调用智能分类识别服务。约束与限制只支持识别JPG、JPEG、PNG、BMP、TIFF格式图片。

来自：帮助中心

查看更多 →
准备数据

受技术与成本多种因素制约，文字识别服务存在一些约束限制。以通用文字识别API为例，输入数据存在以下约束。其他API的的使用约束请参见约束与限制。只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。图像各边的像素大小在15px到8192px之间。图像中识别区域有效占比超过

来自：帮助中心

查看更多 →
使用流程简介

OCR服务需要用户通过调用API接口，将图片或扫描件中的文字识别成可编辑的文本，然后返回JSON格式的识别结果，用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。关于文字识别的相关声明请参见文字识别服务声明。文字识别服务等级协议请参见华为云服务等级协议。

来自：帮助中心

查看更多 →