识别图片上文字的接口_约束与限制-华为云

约束与限制

支持单图多印章识别。支持图像中印章任意角度的水平旋转。支持圆形章、椭圆章、方形章、三角章和菱形章的检测和识别。能处理反光、暗光等干扰的图片但影响识别精度。身份证识别支持中华人民共和国居民身份证的识别。只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。图像各边的像素大小在15到8192px之间。

来自：帮助中心

查看更多 →
框选参照字段

框选参照字段个数须建议大于4个，越多越好，并尽量分散在图片的四周。参考字段尽量沿着文字边缘框选，精确框住对应文本行为佳。核对右侧“框选参照字段”中的参照字段是否与框选的参照字段一致。框选并核对完所有模板图片的参照字段后，单击“下一步”，进入框选识别区步骤。父主题：多模板分类工作流

来自：帮助中心

查看更多 →
OCR服务使用简介

OCR服务使用简介文字识别（Optical Character Recognition，简称OCR）指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式。 OCR以开放API（Application Programming Interface，应用程序编程接口）的方

来自：帮助中心

查看更多 →
框选识别区

框选识别区应尽量扩大识别区范围，使所框选识别区覆盖字段值可能出现的区域。在右侧“框选识别区”中填写“框选字段”，选择“字段类型”。 “字段类型”指待识别文字的内容，您可以在默认字段类型中选择，当前可选择的默认字段类型包括“日期”、“小写金额”、“大写金额”、“数字”、“数字和英文”、“编号”、“性别”，每个识别区可选择多个字段类型。

来自：帮助中心

查看更多 →
框选参照字段

框选参照字段个数须建议大于4个，越多越好，并尽量分散在图片的四周。参考字段尽量沿着文字边缘框选，精确框住对应文本行为佳。核对右侧“框选参照字段”中的参照字段是否与框选的参照字段一致。框选并核对完所有模板图片的参照字段后，单击“下一步”，进入框选识别区步骤。父主题：多模板分类工作流

来自：帮助中心

查看更多 →
票据类

票据类功能介绍增值税发票识别通过对增值税发票图片预处理、表格提取、文字提取、文字识别、结构化信息输出等一系列技术化手段，快速将增值税发票上的文字信息识别出来，用于后续的进一步处理，节省大量的人工录入成本。机动车销售发票识别自动识别机动车销售发票图片内的文本内容，并返回结构化字

来自：帮助中心

查看更多 →
证件类

自动识别图片中的车牌信息。名片识别自动识别名片中的信息，识别信息包括姓名、职位头衔、公司、部门、联系方式、地址、邮箱、传真、邮编、公司网址等信息，并将识别结果返回给用户。 VIN码识别自动识别图片上的车架号信息。泰文身份证识别自动识别身份证上的全部信息，一次扫描即可识别身份证号码、姓名、地址等全部信息。

来自：帮助中心

查看更多 →
自定义OCR介绍

作流，自主构建文字识别模板，识别模板图片中的文字，提供高精度的文字识别模型，保证结构化信息提取精度。通用单模板工作流通过构建文字识别模板，识别单个板式图片中的文字，提供高精度的文字识别模型，保证结构化信息提取精度。多模板分类工作流支持用户自定义多个文字识别模板，通过AI分

来自：帮助中心

查看更多 →
通用表格识别

单字符的置信度，置信度越大，表示本次识别的文字的可靠性越高，在统计意义上，置信度越大，准确率越高。置信度由算法给出，不直接等价于对应字段的准确率。 char_location Array<Array<Integer>> 单字符的位置信息，列表形式，分别表示文字块4个顶点的x, y

来自：帮助中心

查看更多 →
框选识别区

找出与待识别文字最相似的取值，作为识别结果。自定义正则提取预过滤对初始的待识别文字进行预处理。左边输入框填写待识别文字中被替换字符的正则表达式。右边输入框填写所替换的新字符。不填写时，默认不做预处理。如果需要多次预处理，可单击，填写新增的预处理规则。例如： “字段类型名称”：“出生日期”

来自：帮助中心

查看更多 →
框选识别区

框选识别区在文字识别过程中，需要确定图片中识别的文字位置，这就需要在图片模板中框选识别区。识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段，且位置固定不变，因此模型可以通过识别区找到需要识别内容的位置。前提条件已在自定义OCR控制台选择“通用单模

来自：帮助中心

查看更多 →
框选参照字段

框选参照字段在文字识别过程中，套件会检查所识别图片与模板图片是否为同一种模板，并将识别图片校正后再提取结构化信息，支持图片平移、旋转与拉伸变换。为了检查并校正待识别的图片，这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板，通过参照字段的位置来校正待识别图片。

来自：帮助中心

查看更多 →
API是否可以混用

API是否可以混用不建议混用，例如有专门的身份证识别，就不建议使用“通用文字识别”识别身份证图片，不同接口底层算法不同，混用会导致识别效果差。父主题： API使用类

来自：帮助中心

查看更多 →
部署服务

部署服务评估模板应用后，就可以部署多模板应用至文字识别开发套件中，开发属于自己的文字识别应用，此应用用于识别自己所上传的图片属于哪种模板以及识别图片中的文字。前提条件已在文字识别套件控制台选择“多模板分类工作流”新建应用，并完成评估模板步骤，详情请见评估应用。操作步骤在

来自：帮助中心

查看更多 →
驾驶证识别

携带正确的ID，正常使用OCR服务，账单的企业项目会被分类到企业ID对应的企业项目中。携带格式正确但不存在的ID，正常使用OCR服务，账单的企业项目会显示对应不存在的企业项目ID。不携带ID或格式错误ID（包含特殊字符等），正常使用OCR服务，账单的企业项目会被分类到"default"中。表3 请求Body参数

来自：帮助中心

查看更多 →
框选识别区

'an”中找出与待识别文字最相似的取值，作为识别结果。自定义正则提取预过滤对初始的待识别文字进行预处理。左边输入框填写待识别文字中被替换字符的正则表达式。右边输入框填写所替换的新字符。不填写时，默认不做预处理。如果需要多次预处理，可单击，填写新增的预处理规则。例如：

来自：帮助中心

查看更多 →
如何提高识别精度

如何提高识别精度尽量使用文字清晰度高、无反光的图片。进行图片采集时，尽量提高待识别文字区域占比，减少无关背景占比，保持图片内文字清晰人眼可辨认。若图片有旋转角度，算法支持自动修正，建议图片不要过度倾斜。图片尺寸方面，建议最长边不超过8192像素，最短边不小于15像素，图像长宽比例维持常见水平

来自：帮助中心

查看更多 →
如何提高识别速度

如何提高识别速度识别速度与图片大小有关，图片大小会影响网络传输、图片base64解码等处理过程的时间，因此建议在图片文字清晰的情况下，适当压缩图片的大小，以便降低图片识别时间。推荐上传JPG图片格式。根据实践经验，一般建议证件类的小图(文字少)在1M以下，A4纸大小的密集文档大图在2M以下。

来自：帮助中心

查看更多 →
银行卡识别

携带正确的ID，正常使用OCR服务，账单的企业项目会被分类到企业ID对应的企业项目中。携带格式正确但不存在的ID，正常使用OCR服务，账单的企业项目会显示对应不存在的企业项目ID。不携带ID或格式错误ID（包含特殊字符等），正常使用OCR服务，账单的企业项目会被分类到"default"中。表3 请求Body参数

来自：帮助中心

查看更多 →
如何选取参照字段？

如何选取参照字段？参照字段是在所有图片中，文字位置和内容均不发生变化的文字。参照字段有两个作用：在单模板应用中，用于矫正识别图片，从而找准识别字段；在多模板应用中，参照字段的内容和位置将作为相应模板的分类特征。在框选参照字段时，首先要确保所框选的文字位置和内容都固定不变，如果不

来自：帮助中心

查看更多 →
车辆通行费发票识别

Object 字段的置信度，取值范围0~1。置信度越大，本次识别的字段的可靠性越高，在统计意义上，置信度越大，准确率越高。置信度由算法给出，不直接等价于字段的准确率。 text_location Object 对应所有在原图上识别到的字段位置信息，包含所有文字区域四个顶点的二维坐标（x

来自：帮助中心

查看更多 →