图片识别文字接口_自定义OCR介绍-华为云

自定义OCR介绍

自定义OCR基于丰富的文字识别算法和行业知识积累，帮助客户快速构建满足不同业务场景需求的文字识别服务，实现多种版式图像的文字信息结构化提取。工作流自定义OCR当前提供了单模板工作流和多模板工作流，自主构建文字识别模板，识别模板图片中的文字，提供高精度的文字识别模型，保证结构化信息提取精度。

来自：帮助中心

查看更多 →
方案概述

FunctionGraph，用于实现调用文字识别服务业务逻辑，当收到OBS上传图片通知后，自动调用文字识别 OCR服务进行电子面单识别、网络图片识别并将结果存放在OBS桶内。使用文字识别 OCR，提供电子面单识别和网络图片识别。用户只需要将电子面单图片或含有收/寄件信息的截图上传至OBS桶，即可自动识别提取收/

来自：帮助中心

查看更多 →
API是否可以混用

API是否可以混用不建议混用，例如有专门的身份证识别，就不建议使用“通用文字识别”识别身份证图片，不同接口底层算法不同，混用会导致识别效果差。父主题： API使用类

来自：帮助中心

查看更多 →
评估

上传测试图片或者上传在线图片，评估模板。图4 评估模板本地上传图片默认进入“本地上传”页签，单击“上传图片”，或者拖拽测试图片至虚线框内上传图片区域，上传本地的图片作为测试图片。上传图片后，右侧会显示文字识别结果，包括“识别区”和对应的“识别结果”。上传在线图片单击“

来自：帮助中心

查看更多 →
框选识别区

框选识别区在文字识别过程中，需要确定图片中识别的文字位置，这就需要在图片模板中框选识别区。识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段，且位置固定不变，因此模型可以通过识别区找到需要识别内容的位置。前提条件已在自定义OCR控制台选择“通用单模

来自：帮助中心

查看更多 →
上传模板图片

上传模板图片在使用多模板分类工作流开发应用之前，必须要明确文字识别的模板类型，明确以哪几种板式图片作为模板训练文字识别模型，基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板，训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。前提条件

来自：帮助中心

查看更多 →
框选参照字段

框选参照字段在文字识别过程中，套件会检查所识别图片与模板图片是否为同一种模板，并将识别图片校正后再提取结构化信息，支持图片平移、旋转与拉伸变换。为了检查并校正待识别的图片，这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板，通过参照字段的位置来校正待识别图片。

来自：帮助中心

查看更多 →
框选识别区

框选识别区在文字识别过程中，需要确定图片中识别的文字位置，这就需要在图片模板中框选识别区。识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段，且位置固定不变，因此模型可以通过识别区找到需要识别内容的位置。前提条件已在文字识别套件控制台选择“通用单模

来自：帮助中心

查看更多 →
上传模板图片

上传模板图片在使用多模板分类工作流开发应用之前，必须要明确文字识别的模板类型，明确以哪几种板式图片作为模板训练文字识别模型，基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板，训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。前提条件

来自：帮助中心

查看更多 →
OCR服务使用简介

OCR服务使用简介文字识别（Optical Character Recognition，简称OCR）指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式。 OCR以开放API（Application Programming Interface，应用程序编程接口）的方

来自：帮助中心

查看更多 →
如何提高识别速度

如何提高识别速度识别速度与图片大小有关，图片大小会影响网络传输、图片base64解码等处理过程的时间，因此建议在图片文字清晰的情况下，适当压缩图片的大小，以便降低图片识别时间。推荐上传JPG图片格式。根据实践经验，一般建议证件类的小图(文字少)在1M以下，A4纸大小的密集文档大图在2M以下。

来自：帮助中心

查看更多 →
通用表格识别

通用表格识别功能介绍识别表格图片中的文字内容，并将识别的结果以JSON格式返回给用户。返回结果将图片区域（words_region）划分为两类：纯文本区（text）和表格区（table），并返回表格结构（row, column）和文本信息。该接口的使用限制请参见约束与限制，详

来自：帮助中心

查看更多 →
图片质量类报错处理办法

图片质量类报错处理办法问题现象调用文字识别API时，产生以下图片质量类报错。错误码AIS.0102：图片格式不支持。错误码AIS.0103：图片尺寸不满足要求。错误码AIS.0104：非支持的图片类型或图片质量差。解决方法请参考产品介绍 > 约束与限制章节检查图片的格式、像素是否符合规范。

来自：帮助中心

查看更多 →
如何选取参照字段？

如何选取参照字段？参照字段是在所有图片中，文字位置和内容均不发生变化的文字。参照字段有两个作用：在单模板应用中，用于矫正识别图片，从而找准识别字段；在多模板应用中，参照字段的内容和位置将作为相应模板的分类特征。在框选参照字段时，首先要确保所框选的文字位置和内容都固定不变，如果不

来自：帮助中心

查看更多 →
如何提高识别精度

如何提高识别精度尽量使用文字清晰度高、无反光的图片。进行图片采集时，尽量提高待识别文字区域占比，减少无关背景占比，保持图片内文字清晰人眼可辨认。若图片有旋转角度，算法支持自动修正，建议图片不要过度倾斜。图片尺寸方面，建议最长边不超过8192像素，最短边不小于15像素，图像长宽比例维持常见水平

来自：帮助中心

查看更多 →
语义识别业务请求接口

语义识别业务请求接口场景描述获取意图模板的匹配情况。接口方法设置成“POST”。 URL https://IP:PORT/oifde/rest/api/speechrecognition 请求说明表1 请求体参数参数名称数据类型参数位置必选/可选描述 userId

来自：帮助中心

查看更多 →
录音文件识别极速版接口

录音文件识别极速版接口功能介绍录音文件识别极速版接口，用于录音文件的同步识别。音频需要上传华为云OBS，提供华为云OBS对象地址，能快速返回识别结果。该接口的使用限制请参见约束与限制，详细使用指导请参见SIS服务使用简介章节。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API

来自：帮助中心

查看更多 →
评估

评估确定模板图片的参照字段和识别区后，需要对模板图片进行评估和考察。您可以通过上传测试图片，在线评估模板的识别情况，保证能正确识别同样模板下其他图片中的识别区文字。前提条件已在自定义OCR控制台选择“通用单模板工作流”创建应用，并完成框选识别区步骤，详情请见框选识别区。进入评估页面

来自：帮助中心

查看更多 →
方案概述

函数工作流：用于实现调用文字识别服务的业务逻辑，当OBS桶收到上传的发票文件后，会自动通知函数调用文字识别服务，并将结果存放到指定的OBS桶里。文字识别服务：提供发票识别与验真服务，识别用户上传的发票内容以及对接国税局系统进行真伪验证。方案优势场景丰富支持发票识别和发票验真功能。

来自：帮助中心

查看更多 →
部署服务

部署服务评估模板应用后，就可以部署模板应用至文字识别开发套件中，开发属于自己的文字识别应用，此应用用于识别自己所上传的模板样式的图片。前提条件已在文字识别套件控制台选择“通用单模板工作流”新建应用，并完成评估模板步骤，详情请见评估应用。操作步骤在“应用开发>部署”页面完

来自：帮助中心

查看更多 →
智能文档解析

false：关闭单朝向模式图片文字方向一致时，打开该开关可提升识别精度；图片文字方向不一致时，关闭该开关可支持多朝向文字识别。未传入该参数时默认为true，既默认图片中的字段为单朝向。 language 否 String 语种选择，未传入该参数时默认为中英文识别模式。参考华为云通用文字支持语种。

来自：帮助中心

查看更多 →