网络
虚拟私有云 VPC
弹性公网IP EIP
弹性负载均衡 ELB
NAT网关 NAT
云专线 DC
虚拟专用网络 VPN
云连接 CC
VPC终端节点 VPCEP
企业路由器 ER
企业交换机 ESW
全球加速 GA
企业连接 EC
云原生应用网络服务
安全与合规
安全技术与应用
Web应用防火墙 WAF
企业主机安全 HSS
云防火墙 CFW
安全云脑 SecMaster
DDoS防护 AAD
数据加密服务 DEW
数据库安全服务 DBSS
云堡垒机 CBH
数据安全中心 DSC
云证书管理服务 CCM
威胁检测服务 MTD
态势感知 SA
认证测试中心 CTC
边缘安全 EdgeSec
应用中间件
微服务引擎 CSE
分布式消息服务Kafka版
分布式消息服务RabbitMQ版
分布式消息服务RocketMQ版
API网关 APIG
分布式缓存服务 DCS
多活高可用服务 MAS
事件网格 EG
管理与监管
统一身份认证服务 IAM
消息通知服务 SMN
云监控服务 CES
应用运维管理 AOM
应用性能管理 APM
云日志服务 LTS
云审计服务 CTS
标签管理服务 TMS
配置审计 Config
应用身份管理服务 OneAccess
资源访问管理 RAM
组织 Organizations
资源编排服务 RFS
优化顾问 OA
IAM 身份中心
云运维中心 COC
资源治理中心 RGC
解决方案
高性能计算 HPC
SAP
混合云灾备
开天工业工作台 MIW
Haydn解决方案工厂
数字化诊断治理专家服务
云生态
云商店
合作伙伴中心
华为云开发者学堂
华为云慧通差旅
开发与运维
软件开发生产线 CodeArts
需求管理 CodeArts Req
流水线 CodeArts Pipeline
代码检查 CodeArts Check
编译构建 CodeArts Build
部署 CodeArts Deploy
测试计划 CodeArts TestPlan
制品仓库 CodeArts Artifact
移动应用测试 MobileAPPTest
CodeArts IDE Online
开源镜像站 Mirrors
性能测试 CodeArts PerfTest
应用管理与运维平台 ServiceStage
云应用引擎 CAE
开源治理服务 CodeArts Governance
华为云Astro轻应用
CodeArts IDE
Astro工作流 AstroFlow
代码托管 CodeArts Repo
漏洞管理服务 CodeArts Inspector
联接 CodeArtsLink
软件建模 CodeArts Modeling
Astro企业应用 AstroPro
CodeArts 盘古助手
华为云Astro大屏应用
计算
弹性云服务器 ECS
Flexus云服务
裸金属服务器 BMS
云手机服务器 CPH
专属主机 DeH
弹性伸缩 AS
镜像服务 IMS
函数工作流 FunctionGraph
云耀云服务器(旧版)
VR云渲游平台 CVR
Huawei Cloud EulerOS
网络
虚拟私有云 VPC
弹性公网IP EIP
弹性负载均衡 ELB
NAT网关 NAT
云专线 DC
虚拟专用网络 VPN
云连接 CC
VPC终端节点 VPCEP
企业路由器 ER
企业交换机 ESW
全球加速 GA
企业连接 EC
云原生应用网络服务
CDN与智能边缘
内容分发网络 CDN
智能边缘云 IEC
智能边缘平台 IEF
CloudPond云服务
安全与合规
安全技术与应用
Web应用防火墙 WAF
企业主机安全 HSS
云防火墙 CFW
安全云脑 SecMaster
DDoS防护 AAD
数据加密服务 DEW
数据库安全服务 DBSS
云堡垒机 CBH
数据安全中心 DSC
云证书管理服务 CCM
威胁检测服务 MTD
态势感知 SA
认证测试中心 CTC
边缘安全 EdgeSec
大数据
MapReduce服务 MRS
数据湖探索 DLI
表格存储服务 CloudTable
可信智能计算服务 TICS
推荐系统 RES
云搜索服务 CSS
数据可视化 DLV
数据接入服务 DIS
数据仓库服务 GaussDB(DWS)
数据治理中心 DataArts Studio
湖仓构建 LakeFormation
智能数据洞察 DataArts Insight
应用中间件
微服务引擎 CSE
分布式消息服务Kafka版
分布式消息服务RabbitMQ版
分布式消息服务RocketMQ版
API网关 APIG
分布式缓存服务 DCS
多活高可用服务 MAS
事件网格 EG
开天aPaaS
应用平台 AppStage
开天企业工作台 MSSE
开天集成工作台 MSSI
API中心 API Hub
云消息服务 KooMessage
交换数据空间 EDS
云地图服务 KooMap
云手机服务 KooPhone
组织成员账号 OrgID
云空间服务 KooDrive
管理与监管
统一身份认证服务 IAM
消息通知服务 SMN
云监控服务 CES
应用运维管理 AOM
应用性能管理 APM
云日志服务 LTS
云审计服务 CTS
标签管理服务 TMS
配置审计 Config
应用身份管理服务 OneAccess
资源访问管理 RAM
组织 Organizations
资源编排服务 RFS
优化顾问 OA
IAM 身份中心
云运维中心 COC
资源治理中心 RGC
区块链
区块链服务 BCS
数字资产链 DAC
华为云区块链引擎服务 HBS
解决方案
高性能计算 HPC
SAP
混合云灾备
开天工业工作台 MIW
Haydn解决方案工厂
数字化诊断治理专家服务
价格
成本优化最佳实践
专属云商业逻辑
云生态
云商店
合作伙伴中心
华为云开发者学堂
华为云慧通差旅
其他
管理控制台
消息中心
产品价格详情
系统权限
客户关联华为云合作伙伴须知
公共问题
宽限期保留期
奖励推广计划
活动
云服务信任体系能力说明
开发与运维
软件开发生产线 CodeArts
需求管理 CodeArts Req
流水线 CodeArts Pipeline
代码检查 CodeArts Check
编译构建 CodeArts Build
部署 CodeArts Deploy
测试计划 CodeArts TestPlan
制品仓库 CodeArts Artifact
移动应用测试 MobileAPPTest
CodeArts IDE Online
开源镜像站 Mirrors
性能测试 CodeArts PerfTest
应用管理与运维平台 ServiceStage
云应用引擎 CAE
开源治理服务 CodeArts Governance
华为云Astro轻应用
CodeArts IDE
Astro工作流 AstroFlow
代码托管 CodeArts Repo
漏洞管理服务 CodeArts Inspector
联接 CodeArtsLink
软件建模 CodeArts Modeling
Astro企业应用 AstroPro
CodeArts 盘古助手
华为云Astro大屏应用
存储
对象存储服务 OBS
云硬盘 EVS
云备份 CBR
高性能弹性文件服务 SFS Turbo
弹性文件服务 SFS
存储容灾服务 SDRS
云硬盘备份 VBS
云服务器备份 CSBS
数据快递服务 DES
云存储网关 CSG
专属分布式存储服务 DSS
数据工坊 DWR
地图数据 MapDS
键值存储服务 KVS
容器
云容器引擎 CCE
云容器实例 CCI
容器镜像服务 SWR
云原生服务中心 OSC
应用服务网格 ASM
华为云UCS
数据库
云数据库 RDS
数据复制服务 DRS
文档数据库服务 DDS
分布式数据库中间件 DDM
云数据库 GaussDB
云数据库 GeminiDB
数据管理服务 DAS
数据库和应用迁移 UGO
云数据库 TaurusDB
人工智能
AI开发平台ModelArts
华为HiLens
图引擎服务 GES
图像识别 Image
文字识别 OCR
自然语言处理 NLP
内容审核 Moderation
图像搜索 ImageSearch
医疗智能体 EIHealth
企业级AI应用开发专业套件 ModelArts Pro
人脸识别服务 FRS
对话机器人服务 CBS
语音交互服务 SIS
人证核身服务 IVS
视频智能分析服务 VIAS
城市智能体
自动驾驶云服务 Octopus
盘古大模型 PanguLargeModels
IoT物联网
设备接入 IoTDA
IoT物联网
全球SIM联接 GSL
IoT数据分析 IoTA
路网数字化服务 DRIS
IoT边缘 IoTEdge
设备发放 IoTDP
企业应用
域名注册服务 Domains
云解析服务 DNS
企业门户 EWP
ICP备案
商标注册
华为云WeLink
华为云会议 Meeting
隐私保护通话 PrivateNumber
语音通话 VoiceCall
消息&短信 MSGSMS
云管理网络
SD-WAN 云服务
边缘数据中心管理 EDCM
云桌面 Workspace
应用与数据集成平台 ROMA Connect
ROMA资产中心 ROMA Exchange
API全生命周期管理 ROMA API
政企自服务管理 ESM
视频
实时音视频 SparkRTC
视频直播 Live
视频点播 VOD
媒体处理 MPC
视频接入服务 VIS
数字内容生产线 MetaStudio
迁移
主机迁移服务 SMS
对象存储迁移服务 OMS
云数据迁移 CDM
迁移中心 MGC
专属云
专属计算集群 DCC
开发者工具
SDK开发指南
API签名指南
DevStar
华为云命令行工具服务 KooCLI
Huawei Cloud Toolkit
CodeArts API
云化转型
云架构中心
云采用框架
用户服务
账号中心
费用中心
成本中心
资源中心
企业管理
工单管理
客户运营能力
国际站常见问题
支持计划
专业服务
合作伙伴支持计划
我的凭证
华为云公共事业服务云平台
工业软件
工业数字模型驱动引擎
硬件开发工具链平台云服务
工业数据转换引擎云服务
文档首页/ 文字识别 OCR/ API参考/ API/ 智能分类识别
更新时间:2025-01-23 GMT+08:00
分享

智能分类识别

功能介绍

自动分类识别17+种票证,支持指定票证的结构化识别和印章检测,并以JSON格式返回识别的结构化结果。

接口以列表形式返回图片上要识别票证的位置坐标、结构化识别的内容以及对应的类别。该接口支持的票证类型请见表1,该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。

图1 智能分类示例图
表1 支持票证类型

票证类型

增值税发票(支持识别电子版)

增值税发票(销货清单)

通用机打发票

定额发票

出租车票

火车票

飞机行程单(支持识别电子版)

车辆通行费发票

机动车销售发票

车船票

网约车行程单

身份证

护照

驾驶证(支持识别电子版)

行驶证

道路运输证

银行卡

-

智能分类服务只对识别成功的票证进行计费,识别失败的票证不计费。例如,图片中包含三张票证,有两张识别成功,一张识别失败,此时接口计费两次。

约束与限制

  • 只支持识别PNG、JPG、JPEG、BMP、TIFF、PDF格式数据。
  • 图像各边的像素大小在15px到8192px之间。
  • 支持图像中票证任意角度的水平旋转。
  • PDF格式数据使用第一页作智能分类。

调用方法

请参见如何调用API

前提条件

在使用之前,需要您完成服务申请和认证鉴权,具体操作流程请参见开通服务认证鉴权章节。

用户首次使用需要先申请开通。服务只需要开通一次即可,后面使用时无需再次申请。如未开通服务,调用服务时会提示ModelArts.4204报错,请在调用服务前先进入控制台开通服务,并注意开通服务区域与调用服务的区域保持一致。

URI

POST /v2/{project_id}/ocr/auto-classification

表2 路径参数

参数

是否必选

说明

endpoint

终端节点,即调用API的请求地址。

不同服务不同区域的endpoint不同,您可以从终端节点中获取。

例如,OCR服务在“华北-北京四”区域的“endpoint”“ocr.cn-north-4.myhuaweicloud.com”

project_id

项目ID,您可以从获取项目ID中获取。

请求参数

表3 请求Header参数

参数

是否必选

参数类型

描述

X-Auth-Token

String

用户Token。

用于获取操作API的权限。获取Token接口响应消息头中X-Subject-Token的值即为Token。

Content-Type

String

发送的实体的MIME类型,参数值为“application/json”。

Enterprise-Project-Id

String

企业项目ID。OCR支持通过企业项目管理(EPS)对不同用户组和用户的资源使用,进行分账。

获取方法:进入“企业项目管理”页面,单击企业项目名称,在企业项目详情页获取Enterprise-Project-Id(企业项目ID)。

企业项目创建步骤请参见用户指南。

说明:

创建企业项目后,在传参时,有以下三类场景。

  • 携带正确的ID,正常使用OCR服务,账单的企业项目会被分类到企业ID对应的企业项目中。
  • 携带格式正确但不存在的ID,正常使用OCR服务,账单的企业项目会显示对应不存在的企业项目ID。
  • 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单的企业项目会被分类到"default"中。
表4 请求Body参数

参数

是否必选

参数类型

说明

image

String

该参数与url二选一。

图片的Base64编码,要求Base64编码后大小不超过10MB。

图片最短边不小于15px,最长边不超过8192px,支持JPEG、JPG、PNG、BMP、TIFF、PDF格式。

图片Base64编码示例如/9j/4AAQSkZJRgABAg...,带有多余前缀会产生The image format is not supported报错。

url

String

该参数与image二选一。图片大小不超过10MB,图片的url路径目前支持:

  • 公网http/https url例如https://support.huaweicloud.com/api-ocr/zh-cn_image_0000001222608606.png
  • OBS提供的url,使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权,详情参见配置OBS访问权限
说明:
  • 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。
  • 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。
  • url中不能存在中文字符,若存在,中文需要进行utf8编码。

type_list

List

输入图片中,待识别票证的类型,指定后不出现在type_list参数中的票证不识别。不指定时默认返回所有支持类别票证的识别信息。

当前版本支持的票证类型请参见表5

extended_parameters

Object

可指定需要识别票证的传入参数,具体参数可参考各票证API文档。若不指定则默认传入image 。当前版本支持票证类型如下:

  • vat_invoice:增值税发票(含全电发票)
  • quota_invoice:定额发票
  • taxi_invoice:出租车票
  • train_ticket:火车票
  • flight_itinerary:飞机行程单
  • toll_invoice:车辆通行费发票
  • mvs_invoice:机动车销售发票
  • id_card:身份证
  • passport:护照
  • driver_license:驾驶证
  • vehicle_license:行驶证
  • transportation_license:道路运输证
  • bankcard:银行卡
  • bus_ship_ticket:车船票
  • ride_hailing_itinerary:网约车行程单
  • machine_printed_invoice:通用机打发票

增值税发票传参示例:

"extended_parameters" : {
	"vat_invoice" : {
		"advanced_mode" : true,
		"return_text_location" : true
	}
}

车船票传参示例:

"extended_parameters" : {
	"bus_ship_ticket":{
		"return_text_location" : true //开启返回识别到的文字块的区域位置信息。
	}
}
说明:

若指定票证参数填写错误会导致该票证识别错误,会提示"AIS.0101":"The input parameter is invalid."报错。

detect_seal

Boolean

检测印章开关,开启时则返回单张票证是否含有印章,否则不返回是否含有印章。可选值包括:

  • true:开启检测票证是否含有印章功能。
  • false:关闭检测票证是否含有印章功能。
说明:

该功能仅检测判断有无印章,不返回印章具体内容。

pdf_page_number

Integer

指定PDF页码识别。传入该参数时,则识别指定页码的内容。如果不传该参数,则默认识别第1页。

说明:

如果需要指定PDF页码识别,请通过该参数传入页码。目前不支持通过extended_parameters参数指定票证PDF页码。

表5 支持票证类型

归属服务名称

参数值

类型描述

身份证识别

id_card_portrait_side

身份证头像面

id_card_emblem_side

身份证国徽面

行驶证识别

vehicle_license_front

行驶证主页

vehicle_license_back

行驶证副页

驾驶证识别

driver_license_front

驾驶证主页

driver_license_back

驾驶证副页

护照识别

china_passport或foreign_passport

护照

银行卡识别

bankcard

银行卡

道路运输证识别

transportation_license

道路运输证

增值税发票识别

vat_invoice

增值税专用发票

增值税普通发票

增值税电子普通发票(含区块链发票)

增值税电子专用发票

增值税电子普通发票(通行费)

全电发票(不含行业类发票)

vat_roll_invoice

增值税普通发票(卷票)

vat_invoice_sales_list

增值税发票(销货清单)

机动车销售统一发票识别

mvs_invoice

机动车销售统一发票

出租车发票识别

taxi_invoice

出租车发票

火车票识别

train_ticket

火车票

定额发票识别

quota_invoice

定额发票

车辆通行费发票识别

toll_invoice

车辆通行费发票

飞机行程单识别

flight_itinerary

飞机行程单

智能分类识别

bus_ship_ticket

车船票

ride_hailing_itinerary

网约车行程单

machine_printed_invoice

通用机打发票

响应参数

根据识别的结果,可能有不同的HTTP响应状态码(status code)。例如,200表示API调用成功,400表示调用失败,详细的状态码和响应参数说明如下。

状态码: 200

表6 响应Body参数

参数

参数类型

描述

result

Array of AutoClassificationResult objects

识别结果。

调用失败时不返回此字段。

表7 AutoClassificationResult

参数

参数类型

描述

status

status object

指示各对应票证的识别状态。

content

Object

对应票证具体结构化识别的结果。具体每个票证类别的响应参数请参考各API接口文档。

type

String

对应票证的类别。

location

Array<Array<Integer>>

文字块的区域位置信息,列表形式,包含文字区域四个顶点的二维坐标(x,y);坐标原点为图片左上角,x轴沿水平方向,y轴沿竖直方向。

seal_mark

Boolean

对应票证中是否含有印章。可选值包括:

  • true:该票证中含有印章。
  • false:该票证中不含有印章。
表8 BusShipTicketResult 车船票识别

参数

参数类型

描述

title

String

标题。

code

String

发票代码。

number

String

发票号码。

name

String

乘车人姓名。

id_number

String

乘车人身份证号。

departure_date

String

出发日期。

departure_time

String

出发时间。

departure_station

String

出发车站。

destination_station

String

达到车站。

total_amount

String

金额。

province

String

省份。

city

String

城市。

currency

String

币种(“默认RMB”)。

confidence

Map<String,Number>

相关字段的置信度信息,置信度越大,表示本次识别的对应字段的可靠性越高,在统计意义上,置信度越大,准确率越高。注:置信度由算法给出,不直接等价于对应字段的准确率。

表9 MachinePrintedInvoiceResult 通用机打发票识别

参数

参数类型

描述

title

String

发票名称。

code

String

发票代码。

number

String

发票号码。

date

String

开票日期。

time

String

时间。

check_code

String

校验码。

industry

String

行业分类。

category

String

种类。

province

String

省。

city

String

市。

buyer_name

String

购买方名称。

buyer_id

String

购买方纳税人识别号。

buyer_address_tel

String

购买方地址及电话。

buyer_bank_account

String

购买方银行及账号。

payment_info

String

经办人支付信息。

ticket_pickup_user

String

经办人取票用户。

merchant_number

String

经办人商户号。

order_number

String

经办人订单号。

item_list

Array of ItemList Objects

项目列表。

subtotal_tax

String

合计税额。

subtotal_amount

String

合计金额。

total_in_words

String

价税合计(大写)。

total

String

价税合计(小写)。

seller_name

String

销售方名称。

seller_id

String

销售方纳税人识别号。

seller_address_tel

String

销售方地址及电话。

seller_bank_account

String

销售方银行及账号。

receiptor

String

收款人。

reviewer

String

复核人。

issuer

String

开票人。

company_seal_mark

Boolean

是否含有公司印章,取值为true或false:

  • 含有公司印章:true
  • 不含有公司印章:false

electronic_mark

Boolean

是否为浙江/广东通用机打电子发票,取值为true或false:

  • 是浙江/广东通用机打电子发票:true
  • 不是浙江/广东通用机打电子发票:false
表10 MachinePrintedInvoiceItemList 通用机打发票识别

参数

参数类型

描述

name

String

项目名称。

specification

String

规格型号。

unit

String

单位。

quantity

String

数量。

unit_price

String

单价。

amount

String

金额。

tax_rate

String

税率。

tax

String

税额。

表11 RideHailingItinerary 网约车行程单识别

参数

参数类型

描述

title

String

标题。

date

String

申请日期。

date_start

String

行程开始时间。

date_end

String

行程结束时间。

phone_number

String

行程人手机号。

total

String

总计金额。

itineraries

String

行程数。

items_list

Array of RideItineraryResult object

行程信息列表。

表12 RideItineraryResult 网约车行程单识别

参数

参数类型

描述

serial_number

String

序号。

vehicle_type

String

车型。

pickup_time

String

上车时间。

dropoff_time

String

下车时间。

city

String

城市。

departure

String

起点。

destination

String

终点。

mileage

String

里程。

amount

String

金额。

provider

String

服务商。

time_order

String

下单时间。

remarks

String

备注。

表13 status

参数

参数类型

描述

error_code

String

指示各对应票证的状态码。

error_msg

String

指示各对应票证的状态信息。

状态码: 400

表14 响应Body参数

参数

参数类型

说明

error_code

String

调用失败时的错误码,具体请参见错误码

调用成功时不返回此字段。

error_msg

String

调用失败时返回的错误信息。

调用成功时不返回此字段。

请求示例

  • “endpoint”即调用API的请求地址,不同服务不同区域的“endpoint”不同,具体请参见终端节点

    例如,智能分类识别服务部署在“华北-北京四”区域的“endpoint”“ocr.cn-north-4.myhuaweicloud.com”“ocr.cn-north-4.myhuaweicloud.cn”,请求URL为“https://ocr.cn-north-4.myhuaweicloud.com/v2/{project_id}/ocr/auto-classification”“project_id”为项目ID,获取方法请参见获取项目ID

  • 如何获取Token请参见认证鉴权
  • 传入图片的base64编码,进行图片分类和内容识别
    POST https://{endpoint}/v1.0/ocr/auto-classification
    Request Header:
    Content-Type: application/json   
    X-Auth-Token: MIINRwYJKoZIhvcNAQcCoIINODCCDTQCAQExDTALBglghkgBZQMEAgEwgguVBgkqhkiG...
    Request Body: 
    {
       "image":"/9j/4AAQSkZJRgABAgEASABIAAD/4RFZRXhpZgAATU0AKgAAAA..."
    }
  • 传入图片的url,进行图片分类和内容识别
    POST https://{endpoint}/v2/{project_id}/ocr/auto-classification
    Request Header:
    Content-Type: application/json   
    X-Auth-Token: MIINRwYJKoZIhvcNAQcCoIINODCCDTQCAQExDTALBglghkgBZQMEAgEwgguVBgkqhkiG...
    Request Body: 
    {
       "url":"https://BucketName.obs.xxxx.com/ObjectName"
    }

响应示例

状态码:200

成功响应示例

{
  "result" : [ {
    "status" : {
      "error_code" : "AIS.0000",
      "error_msg" : "Succeeded."
    },
    "type" : "bus_ship_ticket",
    "location" : [ [ 10, 11 ], [ 607, 9 ], [ 608, 244 ], [ 9, 247 ] ],
    "content" : {
      "title" : "台州市xxx经营有限公司汽车客运机1打310",
      "code" : "133101982501",
      "number" : "00462506",
      "departure_date" : "2020年12月02日",
      "departure_time" : "20:00",
      "total_amount" : "9.00",
      "departure_station" : "黄岩站",
      "destination_station" : "温岭火车",
      "name" : "鲁xx",
      "id_number" : "331021xxxxxx3018",
      "province" : "浙江省",
      "city" : "台州市",
      "currency" : "RMB",
      "confidence" : {
        "title" : 0.322,
        "code" : 0.9344,
        "number" : 0.9864,
        "departure_date" : 0.9992,
        "departure_time" : 0.964,
        "total_amount" : 0.9992,
        "departure_station" : 0.9984,
        "destination_station" : 0.9232,
        "name" : 0.9024,
        "id_number" : 0.9752,
        "province" : 0.9999,
        "city" : 0.9999,
        "currency" : 0.9999
      }
    },
    "seal_mark" : true
  }, {
    "status" : {
      "error_code" : "AIS.0000",
      "error_msg" : "Succeeded."
    },
    "type" : "ride_hailing_itinerary",
    "location" : [ [ 70, 330 ], [ 560, 330 ], [ 559, 558 ], [ 70, 557 ] ],
    "content" : {
      "title" : "xx出行-行程单",
      "date" : "2020-06-28",
      "date_start" : "2020-06-19",
      "date_end" : "2020-06-24",
      "phone_number" : "17xxxx99344",
      "total" : "351.40",
      "itineraries" : "2",
      "items_list" : [ {
        "serial_number" : "1",
        "vehicle_type" : "快车",
        "pickup_time" : "06-19 21:37 周五",
        "dropoff_time" : "",
        "city" : "北京市",
        "departure" : "xxxx有限公司-西门",
        "destination" : "北家路一区",
        "mileage" : "45",
        "amount" : "166.90",
        "provider" : "",
        "time_order" : "",
        "remarks" : ""
      }, {
        "serial_number" : "2",
        "vehicle_type" : "快车",
        "pickup_time" : "06-24 21:46 周三",
        "dropoff_time" : "",
        "city" : "北京市",
        "departure" : "xxxx有限公司-西门",
        "destination" : "北家路一区",
        "mileage" : "34.48",
        "amount" : "144.10",
        "provider" : "",
        "time_order" : "",
        "remarks" : ""
      } ]
    },
    "seal_mark" : true
  }, {
    "status" : {
      "error_code" : "AIS.0104",
      "error_msg" : "The image is not supported or the image quality is poor."
    },
    "type" : "quota_invoice",
    "location" : [ [ 816, 103 ], [ 2125, 103 ], [ 2125, 978 ], [ 816, 978 ] ],
    "content" : { },
    "seal_mark" : false
  } ]
}

状态码:400

失败响应示例
{
    "error_code": "AIS.0103", 
    "error_msg": "The image size does not meet the requirements." 
}

SDK代码示例

SDK代码示例如下。

使用SDK前建议将SDK更新至最新版,防止本地旧版SDK无法使用最新的OCR功能。

  • 传入图片的base64编码,进行图片分类和内容识别
     1
     2
     3
     4
     5
     6
     7
     8
     9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    package com.huaweicloud.sdk.test;
    
    import com.huaweicloud.sdk.core.auth.ICredential;
    import com.huaweicloud.sdk.core.auth.BasicCredentials;
    import com.huaweicloud.sdk.core.exception.ConnectionException;
    import com.huaweicloud.sdk.core.exception.RequestTimeoutException;
    import com.huaweicloud.sdk.core.exception.ServiceResponseException;
    import com.huaweicloud.sdk.ocr.v1.region.OcrRegion;
    import com.huaweicloud.sdk.ocr.v1.*;
    import com.huaweicloud.sdk.ocr.v1.model.*;
    
    import java.util.List;
    import java.util.ArrayList;
    
    public class RecognizeAutoClassificationSolution {
    
        public static void main(String[] args) {
            // The AK and SK used for authentication are hard-coded or stored in plaintext, which has great security risks. It is recommended that the AK and SK be stored in ciphertext in configuration files or environment variables and decrypted during use to ensure security.
            // In this example, AK and SK are stored in environment variables for authentication. Before running this example, set environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment
            String ak = System.getenv("CLOUD_SDK_AK");
            String sk = System.getenv("CLOUD_SDK_SK");
    
            ICredential auth = new BasicCredentials()
                    .withAk(ak)
                    .withSk(sk);
    
            OcrClient client = OcrClient.newBuilder()
                    .withCredential(auth)
                    .withRegion(OcrRegion.valueOf("<YOUR REGION>"))
                    .build();
            RecognizeAutoClassificationRequest request = new RecognizeAutoClassificationRequest();
            AutoClassificationRequestBody body = new AutoClassificationRequestBody();
            List<String> listbodyTypeList = new ArrayList<>();
            listbodyTypeList.add("vat_invoice");
            listbodyTypeList.add("train_ticket");
            listbodyTypeList.add("taxi_invoice");
            body.withExtendedParameters("{\"toll_invoice\":{},\"mvs_invoice\":{},\"taxi_invoice\":{\"return_text_location\":true},\"id_card\":{\"return_verification\":true,\"detect_copy\":true,\"return_text_location\":true,\"detect_reproduce\":true},\"vehicle_license\":{\"return_issuing_authority\":true,\"return_text_location\":true},\"quota_invoice\":{},\"vat_invoice\":{\"advanced_mode\":true,\"return_text_location\":true},\"flight_itinerary\":{},\"transportation_license\":{},\"passport\":{},\"train_ticket\":{\"return_text_location\":true},\"bankcard\":{\"return_text_location\":true},\"driver_license\":{\"return_issuing_authority\":true,\"return_text_location\":true}}");
            body.withTypeList(listbodyTypeList);
            body.withImage("/9j/4AAQSkZJRgABAgEASABIAAD/4RFZRXhpZgAATU0AKgAAAA...");
            request.withBody(body);
            try {
                RecognizeAutoClassificationResponse response = client.recognizeAutoClassification(request);
                System.out.println(response.toString());
            } catch (ConnectionException e) {
                e.printStackTrace();
            } catch (RequestTimeoutException e) {
                e.printStackTrace();
            } catch (ServiceResponseException e) {
                e.printStackTrace();
                System.out.println(e.getHttpStatusCode());
                System.out.println(e.getRequestId());
                System.out.println(e.getErrorCode());
                System.out.println(e.getErrorMsg());
            }
        }
    }
    
  • 传入图片的url,进行图片分类和内容识别
     1
     2
     3
     4
     5
     6
     7
     8
     9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    package com.huaweicloud.sdk.test;
    
    import com.huaweicloud.sdk.core.auth.ICredential;
    import com.huaweicloud.sdk.core.auth.BasicCredentials;
    import com.huaweicloud.sdk.core.exception.ConnectionException;
    import com.huaweicloud.sdk.core.exception.RequestTimeoutException;
    import com.huaweicloud.sdk.core.exception.ServiceResponseException;
    import com.huaweicloud.sdk.ocr.v1.region.OcrRegion;
    import com.huaweicloud.sdk.ocr.v1.*;
    import com.huaweicloud.sdk.ocr.v1.model.*;
    
    
    public class RecognizeAutoClassificationSolution {
    
        public static void main(String[] args) {
            // The AK and SK used for authentication are hard-coded or stored in plaintext, which has great security risks. It is recommended that the AK and SK be stored in ciphertext in configuration files or environment variables and decrypted during use to ensure security.
            // In this example, AK and SK are stored in environment variables for authentication. Before running this example, set environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment
            String ak = System.getenv("CLOUD_SDK_AK");
            String sk = System.getenv("CLOUD_SDK_SK");
    
            ICredential auth = new BasicCredentials()
                    .withAk(ak)
                    .withSk(sk);
    
            OcrClient client = OcrClient.newBuilder()
                    .withCredential(auth)
                    .withRegion(OcrRegion.valueOf("<YOUR REGION>"))
                    .build();
            RecognizeAutoClassificationRequest request = new RecognizeAutoClassificationRequest();
            AutoClassificationRequestBody body = new AutoClassificationRequestBody();
            body.withUrl("https://BucketName.obs.myhuaweicloud.com/ObjectName");
            request.withBody(body);
            try {
                RecognizeAutoClassificationResponse response = client.recognizeAutoClassification(request);
                System.out.println(response.toString());
            } catch (ConnectionException e) {
                e.printStackTrace();
            } catch (RequestTimeoutException e) {
                e.printStackTrace();
            } catch (ServiceResponseException e) {
                e.printStackTrace();
                System.out.println(e.getHttpStatusCode());
                System.out.println(e.getRequestId());
                System.out.println(e.getErrorCode());
                System.out.println(e.getErrorMsg());
            }
        }
    }
    
  • 传入图片的base64编码,进行图片分类和内容识别
     1
     2
     3
     4
     5
     6
     7
     8
     9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    # coding: utf-8
    
    from huaweicloudsdkcore.auth.credentials import BasicCredentials
    from huaweicloudsdkocr.v1.region.ocr_region import OcrRegion
    from huaweicloudsdkcore.exceptions import exceptions
    from huaweicloudsdkocr.v1 import *
    
    if __name__ == "__main__":
        # The AK and SK used for authentication are hard-coded or stored in plaintext, which has great security risks. It is recommended that the AK and SK be stored in ciphertext in configuration files or environment variables and decrypted during use to ensure security.
        # In this example, AK and SK are stored in environment variables for authentication. Before running this example, set environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment
        ak = os.getenv("CLOUD_SDK_AK")
        sk = os.getenv("CLOUD_SDK_SK")
    
        credentials = BasicCredentials(ak, sk) \
    
        client = OcrClient.new_builder() \
            .with_credentials(credentials) \
            .with_region(OcrRegion.value_of("<YOUR REGION>")) \
            .build()
    
        try:
            request = RecognizeAutoClassificationRequest()
            listTypeListbody = [
                "vat_invoice",
                "train_ticket",
                "taxi_invoice"
            ]
            request.body = AutoClassificationRequestBody(
                extended_parameters="{\"toll_invoice\":{},\"mvs_invoice\":{},\"taxi_invoice\":{\"return_text_location\":true},\"id_card\":{\"return_verification\":true,\"detect_copy\":true,\"return_text_location\":true,\"detect_reproduce\":true},\"vehicle_license\":{\"return_issuing_authority\":true,\"return_text_location\":true},\"quota_invoice\":{},\"vat_invoice\":{\"advanced_mode\":true,\"return_text_location\":true},\"flight_itinerary\":{},\"transportation_license\":{},\"passport\":{},\"train_ticket\":{\"return_text_location\":true},\"bankcard\":{\"return_text_location\":true},\"driver_license\":{\"return_issuing_authority\":true,\"return_text_location\":true}}",
                type_list=listTypeListbody,
                image="/9j/4AAQSkZJRgABAgEASABIAAD/4RFZRXhpZgAATU0AKgAAAA..."
            )
            response = client.recognize_auto_classification(request)
            print(response)
        except exceptions.ClientRequestException as e:
            print(e.status_code)
            print(e.request_id)
            print(e.error_code)
            print(e.error_msg)
    
  • 传入图片的url,进行图片分类和内容识别
     1
     2
     3
     4
     5
     6
     7
     8
     9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    # coding: utf-8
    
    from huaweicloudsdkcore.auth.credentials import BasicCredentials
    from huaweicloudsdkocr.v1.region.ocr_region import OcrRegion
    from huaweicloudsdkcore.exceptions import exceptions
    from huaweicloudsdkocr.v1 import *
    
    if __name__ == "__main__":
        # The AK and SK used for authentication are hard-coded or stored in plaintext, which has great security risks. It is recommended that the AK and SK be stored in ciphertext in configuration files or environment variables and decrypted during use to ensure security.
        # In this example, AK and SK are stored in environment variables for authentication. Before running this example, set environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment
        ak = os.getenv("CLOUD_SDK_AK")
        sk = os.getenv("CLOUD_SDK_SK")
    
        credentials = BasicCredentials(ak, sk) \
    
        client = OcrClient.new_builder() \
            .with_credentials(credentials) \
            .with_region(OcrRegion.value_of("<YOUR REGION>")) \
            .build()
    
        try:
            request = RecognizeAutoClassificationRequest()
            request.body = AutoClassificationRequestBody(
                url="https://BucketName.obs.myhuaweicloud.com/ObjectName"
            )
            response = client.recognize_auto_classification(request)
            print(response)
        except exceptions.ClientRequestException as e:
            print(e.status_code)
            print(e.request_id)
            print(e.error_code)
            print(e.error_msg)
    
  • 传入图片的base64编码,进行图片分类和内容识别
     1
     2
     3
     4
     5
     6
     7
     8
     9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    package main
    
    import (
    	"fmt"
    	"github.com/huaweicloud/huaweicloud-sdk-go-v3/core/auth/basic"
        ocr "github.com/huaweicloud/huaweicloud-sdk-go-v3/services/ocr/v1"
    	"github.com/huaweicloud/huaweicloud-sdk-go-v3/services/ocr/v1/model"
        region "github.com/huaweicloud/huaweicloud-sdk-go-v3/services/ocr/v1/region"
    )
    
    func main() {
        // The AK and SK used for authentication are hard-coded or stored in plaintext, which has great security risks. It is recommended that the AK and SK be stored in ciphertext in configuration files or environment variables and decrypted during use to ensure security.
        // In this example, AK and SK are stored in environment variables for authentication. Before running this example, set environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment
        ak := os.Getenv("CLOUD_SDK_AK")
        sk := os.Getenv("CLOUD_SDK_SK")
    
        auth := basic.NewCredentialsBuilder().
            WithAk(ak).
            WithSk(sk).
            Build()
    
        client := ocr.NewOcrClient(
            ocr.OcrClientBuilder().
                WithRegion(region.ValueOf("<YOUR REGION>")).
                WithCredential(auth).
                Build())
    
        request := &model.RecognizeAutoClassificationRequest{}
    	var listTypeListbody = []string{
            "vat_invoice",
    	    "train_ticket",
    	    "taxi_invoice",
        }
    	var extendedParametersAutoClassificationRequestBody interface{} = "{\"toll_invoice\":{},\"mvs_invoice\":{},\"taxi_invoice\":{\"return_text_location\":true},\"id_card\":{\"return_verification\":true,\"detect_copy\":true,\"return_text_location\":true,\"detect_reproduce\":true},\"vehicle_license\":{\"return_issuing_authority\":true,\"return_text_location\":true},\"quota_invoice\":{},\"vat_invoice\":{\"advanced_mode\":true,\"return_text_location\":true},\"flight_itinerary\":{},\"transportation_license\":{},\"passport\":{},\"train_ticket\":{\"return_text_location\":true},\"bankcard\":{\"return_text_location\":true},\"driver_license\":{\"return_issuing_authority\":true,\"return_text_location\":true}}"
    	imageAutoClassificationRequestBody:= "/9j/4AAQSkZJRgABAgEASABIAAD/4RFZRXhpZgAATU0AKgAAAA..."
    	request.Body = &model.AutoClassificationRequestBody{
    		ExtendedParameters: &extendedParametersAutoClassificationRequestBody,
    		TypeList: &listTypeListbody,
    		Image: &imageAutoClassificationRequestBody,
    	}
    	response, err := client.RecognizeAutoClassification(request)
    	if err == nil {
            fmt.Printf("%+v\n", response)
        } else {
            fmt.Println(err)
        }
    }
    
  • 传入图片的url,进行图片分类和内容识别
     1
     2
     3
     4
     5
     6
     7
     8
     9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    package main
    
    import (
    	"fmt"
    	"github.com/huaweicloud/huaweicloud-sdk-go-v3/core/auth/basic"
        ocr "github.com/huaweicloud/huaweicloud-sdk-go-v3/services/ocr/v1"
    	"github.com/huaweicloud/huaweicloud-sdk-go-v3/services/ocr/v1/model"
        region "github.com/huaweicloud/huaweicloud-sdk-go-v3/services/ocr/v1/region"
    )
    
    func main() {
        // The AK and SK used for authentication are hard-coded or stored in plaintext, which has great security risks. It is recommended that the AK and SK be stored in ciphertext in configuration files or environment variables and decrypted during use to ensure security.
        // In this example, AK and SK are stored in environment variables for authentication. Before running this example, set environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment
        ak := os.Getenv("CLOUD_SDK_AK")
        sk := os.Getenv("CLOUD_SDK_SK")
    
        auth := basic.NewCredentialsBuilder().
            WithAk(ak).
            WithSk(sk).
            Build()
    
        client := ocr.NewOcrClient(
            ocr.OcrClientBuilder().
                WithRegion(region.ValueOf("<YOUR REGION>")).
                WithCredential(auth).
                Build())
    
        request := &model.RecognizeAutoClassificationRequest{}
    	urlAutoClassificationRequestBody:= "https://BucketName.obs.myhuaweicloud.com/ObjectName"
    	request.Body = &model.AutoClassificationRequestBody{
    		Url: &urlAutoClassificationRequestBody,
    	}
    	response, err := client.RecognizeAutoClassification(request)
    	if err == nil {
            fmt.Printf("%+v\n", response)
        } else {
            fmt.Println(err)
        }
    }
    

更多编程语言的SDK代码示例,请参见API Explorer的代码示例页签,可生成自动对应的SDK代码示例。

状态码

状态码

描述

200

成功响应示例

400

失败响应示例

状态码请参见状态码

错误码

错误码请参见错误码

相关文档