ocr识别图片中指定区域文字

构造请求

com/v2/{project_id}/ocr/web-image 图1 URI示意图为查看方便，在每个具体API的URI部分，只给出resource-path部分，并将请求方法写在一起。这是因为URI-scheme都是HTTPS，而endpoint在同一个区域也相同，所以简洁起见将这两部分省略。

来自：帮助中心

查看更多 →
框选识别区

操作步骤图1 多模板框选识别区在“应用开发>框选参照字段”页面上方或者“选择模板”下拉框中选择模板，对每个模板图片进行预处理。单击左上方操作图标，调整当前模板图片到合适大小。单击框选操作图标，单击待识别文字的左上角，移动鼠标框选识别区，使得矩形框覆盖待识别的文字。框选识

来自：帮助中心

查看更多 →
泰国车牌识别

泰国车牌识别功能介绍识别泰国车牌图片中的车牌信息，返回识别结果和车牌的区域位置信息。该接口的使用限制请参见约束与限制，详细使用指导请参见OCR服务使用简介章节。图1 泰国车牌示例图约束与限制只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。图像各边的像素大小在15到8192px之间。

来自：帮助中心

查看更多 →
不动产证识别

与image二选一。图片的URL路径，目前仅支持华为云上OBS提供的匿名公开授权访问的URL以及公网URL。说明：接口响应时间依赖于图片的下载时间，如果图片下载时间过长，会返回接口调用失败。请保证被检测图片所在的存储服务稳定可靠，推荐使用OBS服务存储图片数据。响应参数状态码：

来自：帮助中心

查看更多 →
区域图

显示图例：是否展示图例。图例文字内容来源于数据模型下“s”的取值。图例标记：设置图例小图标形状。图例宽高：设置图例的宽度和高度。图例间隔：设置图例之间的间隔。字体：设置图例的字体、颜色和大小。图例文字内容来源于数据模型下“s”的取值。左间距：图例到饼图组件左侧距离占组件高度的百分比或图例位置的对齐方式设置。

来自：帮助中心

查看更多 →
准备数据

图像中识别区域有效占比超过80%，保证所有文字及其边缘包含在图像内。支持图像任意角度的水平旋转。目前不支持复杂背景（如户外自然场景、防伪水印等）和文字扭曲图像的文字识别。数据传入方式使用OCR API或SDK时，数据主要通过以下两种方法传入。 image 传入图片的base64编码。您可以通过在线

来自：帮助中心

查看更多 →
使用单模板工作流开发应用

只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。图像各边的像素大小在100px到4096px之间。图像中识别区域有效占比超过80%，保证所有文字及其边缘包含在图像内。支持图像任意角度的水平旋转。目前不支持复杂背景（如户外自然场景、防伪水印等）和文字扭曲图像的文字识别。步骤2：新建应用登录ModelArts

来自：帮助中心

查看更多 →
电子面单识别

电子面单识别 OCR电子面单识别将于2025.02.18正式停售，为避免影响您目前的业务，请您及时进行相关迁移工作，详见停售公告。功能介绍识别用户上传的电子面单图片中的文字内容，并将识别的结果以JSON格式返回给用户。图1 电子面单示例图约束与限制电子面单支持的版式以样例为准。

来自：帮助中心

查看更多 →
机动车销售发票识别

机动车销售发票识别功能介绍识别机动车销售发票、二手车销售发票图片中的文字内容，服务能自动分辨两种类型，并将识别的结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制，详细使用指导请参见OCR服务使用简介章节。图1 机动车销售发票示例图图2 机动车销售发票示例图图3 二手车销售发票示例图

来自：帮助中心

查看更多 →
身份证识别

身份证信息核验请使用人证核身服务。图1 身份证示例图身份证识别支持中华人民共和国居民身份证识别。如果图片中包含多张卡证票据，请调用智能分类识别服务。约束与限制支持中华人民共和国居民身份证的识别。只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。图像各边的像素大小在15px到8192px之间。

来自：帮助中心

查看更多 →
增值税发票识别

增值税发票识别功能介绍识别增值税发票的类别，并以JSON格式返回识别的结构化结果，支持识别图片、PDF、OFD文件。该接口的使用限制请参见约束与限制，详细使用指导请参见OCR服务使用简介章节。发票验真API请参见发票验真。图1 增值税发票示例图图2 区块链发票示例图图3 全电发票示例图（专用发票）

来自：帮助中心

查看更多 →
票据类

票据类功能介绍增值税发票识别通过对增值税发票图片预处理、表格提取、文字提取、文字识别、结构化信息输出等一系列技术化手段，快速将增值税发票上的文字信息识别出来，用于后续的进一步处理，节省大量的人工录入成本。机动车销售发票识别自动识别机动车销售发票图片内的文本内容，并返回结构

来自：帮助中心

查看更多 →
配置OCR增强实现文档智能解析

。是，则进行下一步。否，则单击操作列的“开通服务”为操作者开通智能文档解析功能。如图1所示，表示所有人都已开通智能文档解析功能。图1 开通智能文档解析详细操作指导请参见文字识别OCR。步骤2：开通Flexus 企业搜索服务购买智能问答版Flexus企业搜索服务（ KooSearch ）。

来自：帮助中心

查看更多 →
飞机行程单识别

支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。图像各边的像素大小在15px到8192px之间。支持图像中行程单任意角度的水平旋转。能处理反光、暗光等干扰的图片但影响识别精度。调用方法请参见如何调用API。前提条件在使用之前，需要您完成服务申请和认证鉴权，具体操作流程请参见开通服务和认证鉴权章节。

来自：帮助中心

查看更多 →
OCR

类特殊字符，长度为1～128个字符。图片路径是需要识别的图片在OBS上的路径。识别类型是可识别的图片类型, 当前仅支持通用文字识别。可支持扫描文件、电子文档、书籍、票据和表单等多种场景的文字识别。识别结果存储目录是指定识别结果存储的OBS目录。表2 高级参数参数

来自：帮助中心

查看更多 →
车辆合格证识别

与image二选一。图片的URL路径，目前仅支持华为云上OBS提供的匿名公开授权访问的URL以及公网URL。说明：接口响应时间依赖于图片的下载时间，如果图片下载时间过长，会返回接口调用失败。请保证被检测图片所在的存储服务稳定可靠，推荐使用OBS服务存储图片数据。 return_text_location

来自：帮助中心

查看更多 →
文字识别套件使用简介

识别服务，实现多种版式图像的文字信息结构化提取。文字识别套件提供预置工作流供您选择，全流程可视化完成AI应用开发以及持续迭代。选择预置工作流单模板工作流通过工作流指引构建文字识别模板，识别单个板式图片中的文字，快速实现文档、票证等场景的文字识别。详情请见使用单模板工作流开发应用。

来自：帮助中心

查看更多 →
字段类型

义字段类型两种功能。图1 默认字段类型和自定义字段类型默认字段类型自定义字段类型父主题：自定义OCR

来自：帮助中心

查看更多 →
自定义模板OCR

现用户特定格式图片的自动识别和结构化提取。约束与限制只支持识别PNG、JPG、PNG、BMP、TIFF、GIF、WEBP格式图片。图像各边的像素大小在100px到8192px之间。图像中识别区域有效占比超过80%，保证整张表格及其边缘包含在图像内。支持图像任意角度的水平旋转。

来自：帮助中心

查看更多 →
调用SDK实现通用表格识别

调用SDK实现通用表格识别文字识别服务软件开发工具包（OCR SDK）是对文字识别服务提供的REST API进行的封装，以简化用户的开发工作。本章节以通用表格识别API为例，介绍如何使用OCR Python SDK。使用OCR SDK的详细步骤如下所示：步骤1：开通服务步骤2：安装SDK

来自：帮助中心

查看更多 →
配置OBS访问权限

的URL。对文字识别服务开启授权如果您需要使用OBS中的数据，请开通对象存储服务 OBS授权。进入文字识别控制台。打开对象存储服务OBS授权的按钮，完成授权操作。完成授权即可使用授权方式的URL对服务进行访问。图1 OBS授权不支持跨区域OBS，OBS的区域需要和服务保持一致。

来自：帮助中心

查看更多 →