文档首页/ 文字识别 OCR/ API参考/ API/ 智能分类识别
更新时间:2024-07-11 GMT+08:00
分享

智能分类识别

功能介绍

自动分类识别17+种票证,支持指定票证的结构化识别和印章检测,并以JSON格式返回识别的结构化结果。

接口以列表形式返回图片上要识别票证的位置坐标、结构化识别的内容以及对应的类别。该接口支持的票证类型请见表1,该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。

图1 智能分类示例图
表1 支持票证类型

票证类型

增值税发票

增值税发票(销货清单)

通用机打发票

定额发票

出租车票

火车票

飞机行程单

车辆通行费发票

机动车销售发票

车船票

网约车行程单

身份证

护照

驾驶证

行驶证

道路运输证

银行卡

-

智能分类服务只对识别成功的票证进行计费,识别失败的票证不计费。例如,图片中包含三张票证,有两张识别成功,一张识别失败,此时接口计费两次。

约束与限制

  • 只支持识别PNG、JPG、JPEG、BMP、TIFF、PDF格式数据。
  • 图像各边的像素大小在15px到8000px之间。
  • 支持图像中票证任意角度的水平旋转。
  • PDF格式数据使用第一页作智能分类。

调用方法

请参见如何调用API

前提条件

在使用之前,需要您完成服务申请和认证鉴权,具体操作流程请参见开通服务认证鉴权章节。

用户首次使用需要先申请开通。服务只需要开通一次即可,后面使用时无需再次申请。如未开通服务,调用服务时会提示ModelArts.4204报错,请在调用服务前先进入控制台开通服务,并注意开通服务区域与调用服务的区域保持一致。

URI

POST /v2/{project_id}/ocr/auto-classification

表2 路径参数

参数

是否必选

说明

endpoint

终端节点,即调用API的请求地址。

不同服务不同区域的endpoint不同,您可以从终端节点中获取。

例如,OCR服务在“华北-北京四”区域的“endpoint”“ocr.cn-north-4.myhuaweicloud.com”

project_id

项目ID,您可以从获取项目ID中获取。

请求参数

表3 请求Header参数

参数

是否必选

参数类型

描述

X-Auth-Token

String

用户Token。

用于获取操作API的权限。获取Token接口响应消息头中X-Subject-Token的值即为Token。

Content-Type

String

发送的实体的MIME类型,参数值为“application/json”。

Enterprise-Project-Id

String

企业项目ID。OCR支持通过企业项目管理(EPS)对不同用户组和用户的资源使用,进行分账。

获取方法:进入“企业项目管理”页面,单击企业项目名称,在企业项目详情页获取Enterprise-Project-Id(企业项目ID)。

企业项目创建步骤请参见用户指南。

说明:

创建企业项目后,在传参时,有以下三类场景。

  • 携带正确的ID,正常使用OCR服务,账单的企业项目会被分类到企业ID对应的企业项目中。
  • 携带格式正确但不存在的ID,正常使用OCR服务,账单的企业项目会显示对应不存在的企业项目ID。
  • 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单的企业项目会被分类到"default"中。
表4 请求Body参数

参数

是否必选

参数类型

说明

image

String

该参数与url二选一。

图片的Base64编码,要求Base64编码后大小不超过10MB。

图片最短边不小于15px,最长边不超过8000px,支持JPEG、JPG、PNG、BMP、TIFF、PDF格式。

图片Base64编码示例如/9j/4AAQSkZJRgABAg...,带有多余前缀会产生The image format is not supported报错。

url

String

该参数与image二选一。图片的url路径,目前支持:

  • 公网http/https url例如https://support.huaweicloud.com/api-ocr/zh-cn_image_0000001222608606.png
  • OBS提供的url,使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权,详情参见配置OBS访问权限
说明:
  • 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。
  • 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。
  • url中不能存在中文字符,若存在,中文需要进行utf8编码。

type_list

List

输入图片中,待识别票证的类型,指定后不出现在type_list参数中的票证不识别。不指定时默认返回所有支持类别票证的识别信息。

当前版本支持的票证类型请参见表5

extended_parameters

Object

可指定需要识别票证的传入参数,具体参数可参考各票证API文档。若不指定则默认传入image 。当前版本支持票证类型如下:

  • vat_invoice:增值税发票(含全电发票)
  • quota_invoice:定额发票
  • taxi_invoice:出租车票
  • train_ticket:火车票
  • flight_itinerary:飞机行程单
  • toll_invoice:车辆通行费发票
  • mvs_invoice:机动车销售发票
  • id_card:身份证
  • passport:护照
  • driver_license:驾驶证
  • vehicle_license:行驶证
  • transportation_license:道路运输证
  • bankcard:银行卡
  • bus_ship_ticket:车船票
  • ride_hailing_itinerary:网约车行程单
  • machine_printed_invoice:通用机打发票

增值税发票传参示例:

"extended_parameters" : {
	"vat_invoice" : {
		"advanced_mode" : true,
		"return_text_location" : true
	}
}

车船票传参示例:

"extended_parameters" : {
	"bus_ship_ticket":{
		"return_text_location" : true //开启返回识别到的文字块的区域位置信息。
	}
}

通用机打发票传参示例:

"extended_parameters" : {
	"machine_printed_invoice":{
		"pdf_page_number" : 1  //指定PDF页码识别,如果不传该参数,则默认识别第1页。
	}
}
说明:

若指定票证参数填写错误会导致该票证识别错误,会提示"AIS.0101":"The input parameter is invalid."报错。

detect_seal

Boolean

检测印章开关,开启时则返回单张票证是否含有印章,否则不返回是否含有印章。可选值包括:

  • true:开启检测票证是否含有印章功能。
  • false:关闭检测票证是否含有印章功能。
说明:

该功能仅检测判断有无印章,不返回印章具体内容。

表5 支持票证类型

归属服务名称

参数值

类型描述

身份证识别

id_card_portrait_side

身份证头像面

id_card_emblem_side

身份证国徽面

行驶证识别

vehicle_license_front

行驶证主页

vehicle_license_back

行驶证副页

驾驶证识别

driver_license_front

驾驶证主页

driver_license_back

驾驶证副页

护照识别

china_passport或foreign_passport

护照

银行卡识别

bankcard

银行卡

道路运输证识别

transportation_license

道路运输证

增值税发票识别

vat_invoice

增值税专用发票

增值税普通发票

增值税电子普通发票(含区块链发票)

增值税电子专用发票

增值税电子普通发票(通行费)

全电发票(不含行业类发票)

vat_roll_invoice

增值税普通发票(卷票)

vat_invoice_sales_list

增值税发票(销货清单)

机动车销售统一发票识别

mvs_invoice

机动车销售统一发票

出租车发票识别

taxi_invoice

出租车发票

火车票识别

train_ticket

火车票

定额发票识别

quota_invoice

定额发票

车辆通行费发票识别

toll_invoice

车辆通行费发票

飞机行程单识别

flight_itinerary

飞机行程单

智能分类识别

bus_ship_ticket

车船票

ride_hailing_itinerary

网约车行程单

machine_printed_invoice

通用机打发票

响应参数

根据识别的结果,可能有不同的HTTP响应状态码(status code)。例如,200表示API调用成功,400表示调用失败,详细的状态码和响应参数说明如下。

状态码: 200

表6 响应Body参数

参数

参数类型

描述

result

Array of AutoClassificationResult objects

识别结果。

调用失败时不返回此字段。

表7 AutoClassificationResult

参数

参数类型

描述

status

status object

指示各对应票证的识别状态。

content

Object

对应票证具体结构化识别的结果。具体每个票证类别的响应参数请参考各API接口文档。

type

String

对应票证的类别。

location

Array<Array<Integer>>

文字块的区域位置信息,列表形式,包含文字区域四个顶点的二维坐标(x,y);坐标原点为图片左上角,x轴沿水平方向,y轴沿竖直方向。

seal_mark

Boolean

对应票证中是否含有印章。可选值包括:

  • true:该票证中含有印章。
  • false:该票证中不含有印章。
表8 BusShipTicketResult 车船票识别

参数

参数类型

描述

title

String

标题。

code

String

发票代码。

number

String

发票号码。

name

String

乘车人姓名。

id_number

String

乘车人身份证号。

departure_date

String

出发日期。

departure_time

String

出发时间。

departure_station

String

出发车站。

destination_station

String

达到车站。

total_amount

String

金额。

province

String

省份。

city

String

城市。

currency

String

币种(“默认RMB”)。

confidence

Map<String,Number>

相关字段的置信度信息,置信度越大,表示本次识别的对应字段的可靠性越高,在统计意义上,置信度越大,准确率越高。注:置信度由算法给出,不直接等价于对应字段的准确率。

表9 MachinePrintedInvoiceResult 通用机打发票识别

参数

参数类型

描述

title

String

发票名称。

code

String

发票代码。

number

String

发票号码。

date

String

开票日期。

time

String

时间。

check_code

String

校验码。

industry

String

行业分类。

category

String

种类。

province

String

省。

city

String

市。

buyer_name

String

购买方名称。

buyer_id

String

购买方纳税人识别号。

buyer_address_tel

String

购买方地址及电话。

buyer_bank_account

String

购买方银行及账号。

payment_info

String

经办人支付信息。

ticket_pickup_user

String

经办人取票用户。

merchant_number

String

经办人商户号。

order_number

String

经办人订单号。

item_list

Array of ItemList Objects

项目列表。

subtotal_tax

String

合计税额。

subtotal_amount

String

合计金额。

total_in_words

String

价税合计(大写)。

total

String

价税合计(小写)。

seller_name

String

销售方名称。

seller_id

String

销售方纳税人识别号。

seller_address_tel

String

销售方地址及电话。

seller_bank_account

String

销售方银行及账号。

receiptor

String

收款人。

reviewer

String

复核人。

issuer

String

开票人。

company_seal_mark

Boolean

是否含有公司印章,取值为true或false:

  • 含有公司印章:true
  • 不含有公司印章:false

electronic_mark

Boolean

是否为浙江/广东通用机打电子发票,取值为true或false:

  • 是浙江/广东通用机打电子发票:true
  • 不是浙江/广东通用机打电子发票:false
表10 MachinePrintedInvoiceItemList 通用机打发票识别

参数

参数类型

描述

name

String

项目名称。

specification

String

规格型号。

unit

String

单位。

quantity

String

数量。

unit_price

String

单价。

amount

String

金额。

tax_rate

String

税率。

tax

String

税额。

表11 RideHailingItinerary 网约车行程单识别

参数

参数类型

描述

title

String

标题。

date

String

申请日期。

date_start

String

行程开始时间。

date_end

String

行程结束时间。

phone_number

String

行程人手机号。

total

String

总计金额。

itineraries

String

行程数。

items_list

Array of RideItineraryResult object

行程信息列表。

表12 RideItineraryResult 网约车行程单识别

参数

参数类型

描述

serial_number

String

序号。

vehicle_type

String

车型。

pickup_time

String

上车时间。

dropoff_time

String

下车时间。

city

String

城市。

departure

String

起点。

destination

String

终点。

mileage

String

里程。

amount

String

金额。

provider

String

服务商。

time_order

String

下单时间。

remarks

String

备注。

表13 status

参数

参数类型

描述

error_code

String

指示各对应票证的状态码。

error_msg

String

指示各对应票证的状态信息。

状态码: 400

表14 响应Body参数

参数

参数类型

说明

error_code

String

调用失败时的错误码,具体请参见错误码

调用成功时不返回此字段。

error_msg

String

调用失败时返回的错误信息。

调用成功时不返回此字段。

请求示例

  • “endpoint”即调用API的请求地址,不同服务不同区域的“endpoint”不同,具体请参见终端节点

    例如,智能分类识别服务部署在“华北-北京四”区域的“endpoint”“ocr.cn-north-4.myhuaweicloud.com”“ocr.cn-north-4.myhuaweicloud.cn”,请求URL为“https://ocr.cn-north-4.myhuaweicloud.com/v2/{project_id}/ocr/auto-classification”“project_id”为项目ID,获取方法请参见获取项目ID

  • 如何获取Token请参见认证鉴权
  • 传入图片的base64编码,进行图片分类和内容识别
    POST https://{endpoint}/v1.0/ocr/auto-classification
    Request Header:
    Content-Type: application/json   
    X-Auth-Token: MIINRwYJKoZIhvcNAQcCoIINODCCDTQCAQExDTALBglghkgBZQMEAgEwgguVBgkqhkiG...
    Request Body: 
    {
       "image":"/9j/4AAQSkZJRgABAgEASABIAAD/4RFZRXhpZgAATU0AKgAAAA..."
    }
  • 传入图片的url,进行图片分类和内容识别
    POST https://{endpoint}/v2/{project_id}/ocr/auto-classification
    Request Header:
    Content-Type: application/json   
    X-Auth-Token: MIINRwYJKoZIhvcNAQcCoIINODCCDTQCAQExDTALBglghkgBZQMEAgEwgguVBgkqhkiG...
    Request Body: 
    {
       "url":"https://BucketName.obs.xxxx.com/ObjectName"
    }

响应示例

状态码:200

成功响应示例

{
  "result" : [ {
    "status" : {
      "error_code" : "AIS.0000",
      "error_msg" : "Succeeded."
    },
    "type" : "bus_ship_ticket",
    "location" : [ [ 10, 11 ], [ 607, 9 ], [ 608, 244 ], [ 9, 247 ] ],
    "content" : {
      "title" : "台州市xxx经营有限公司汽车客运机1打310",
      "code" : "133101982501",
      "number" : "00462506",
      "departure_date" : "2020年12月02日",
      "departure_time" : "20:00",
      "total_amount" : "9.00",
      "departure_station" : "黄岩站",
      "destination_station" : "温岭火车",
      "name" : "鲁xx",
      "id_number" : "331021xxxxxx3018",
      "province" : "浙江省",
      "city" : "台州市",
      "currency" : "RMB",
      "confidence" : {
        "title" : 0.322,
        "code" : 0.9344,
        "number" : 0.9864,
        "departure_date" : 0.9992,
        "departure_time" : 0.964,
        "total_amount" : 0.9992,
        "departure_station" : 0.9984,
        "destination_station" : 0.9232,
        "name" : 0.9024,
        "id_number" : 0.9752,
        "province" : 0.9999,
        "city" : 0.9999,
        "currency" : 0.9999
      }
    },
    "seal_mark" : true
  }, {
    "status" : {
      "error_code" : "AIS.0000",
      "error_msg" : "Succeeded."
    },
    "type" : "ride_hailing_itinerary",
    "location" : [ [ 70, 330 ], [ 560, 330 ], [ 559, 558 ], [ 70, 557 ] ],
    "content" : {
      "title" : "xx出行-行程单",
      "date" : "2020-06-28",
      "date_start" : "2020-06-19",
      "date_end" : "2020-06-24",
      "phone_number" : "17xxxx99344",
      "total" : "351.40",
      "itineraries" : "2",
      "items_list" : [ {
        "serial_number" : "1",
        "vehicle_type" : "快车",
        "pickup_time" : "06-19 21:37 周五",
        "dropoff_time" : "",
        "city" : "北京市",
        "departure" : "xxxx有限公司-西门",
        "destination" : "北家路一区",
        "mileage" : "45",
        "amount" : "166.90",
        "provider" : "",
        "time_order" : "",
        "remarks" : ""
      }, {
        "serial_number" : "2",
        "vehicle_type" : "快车",
        "pickup_time" : "06-24 21:46 周三",
        "dropoff_time" : "",
        "city" : "北京市",
        "departure" : "xxxx有限公司-西门",
        "destination" : "北家路一区",
        "mileage" : "34.48",
        "amount" : "144.10",
        "provider" : "",
        "time_order" : "",
        "remarks" : ""
      } ]
    },
    "seal_mark" : true
  }, {
    "status" : {
      "error_code" : "AIS.0104",
      "error_msg" : "The image is not supported or the image quality is poor."
    },
    "type" : "quota_invoice",
    "location" : [ [ 816, 103 ], [ 2125, 103 ], [ 2125, 978 ], [ 816, 978 ] ],
    "content" : { },
    "seal_mark" : false
  } ]
}

状态码:400

失败响应示例
{
    "error_code": "AIS.0103", 
    "error_msg": "The image size does not meet the requirements." 
}

SDK代码示例

SDK代码示例如下。

使用SDK前建议将SDK更新至最新版,防止本地旧版SDK无法使用最新的OCR功能。

  • 传入图片的base64编码,进行图片分类和内容识别
     1
     2
     3
     4
     5
     6
     7
     8
     9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    package com.huaweicloud.sdk.test;
    
    import com.huaweicloud.sdk.core.auth.ICredential;
    import com.huaweicloud.sdk.core.auth.BasicCredentials;
    import com.huaweicloud.sdk.core.exception.ConnectionException;
    import com.huaweicloud.sdk.core.exception.RequestTimeoutException;
    import com.huaweicloud.sdk.core.exception.ServiceResponseException;
    import com.huaweicloud.sdk.ocr.v1.region.OcrRegion;
    import com.huaweicloud.sdk.ocr.v1.*;
    import com.huaweicloud.sdk.ocr.v1.model.*;
    
    import java.util.List;
    import java.util.ArrayList;
    
    public class RecognizeAutoClassificationSolution {
    
        public static void main(String[] args) {
            // The AK and SK used for authentication are hard-coded or stored in plaintext, which has great security risks. It is recommended that the AK and SK be stored in ciphertext in configuration files or environment variables and decrypted during use to ensure security.
            // In this example, AK and SK are stored in environment variables for authentication. Before running this example, set environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment
            String ak = System.getenv("CLOUD_SDK_AK");
            String sk = System.getenv("CLOUD_SDK_SK");
    
            ICredential auth = new BasicCredentials()
                    .withAk(ak)
                    .withSk(sk);
    
            OcrClient client = OcrClient.newBuilder()
                    .withCredential(auth)
                    .withRegion(OcrRegion.valueOf("<YOUR REGION>"))
                    .build();
            RecognizeAutoClassificationRequest request = new RecognizeAutoClassificationRequest();
            AutoClassificationRequestBody body = new AutoClassificationRequestBody();
            List<String> listbodyTypeList = new ArrayList<>();
            listbodyTypeList.add("vat_invoice");
            listbodyTypeList.add("train_ticket");
            listbodyTypeList.add("taxi_invoice");
            body.withExtendedParameters("{\"toll_invoice\":{},\"mvs_invoice\":{},\"taxi_invoice\":{\"return_text_location\":true},\"id_card\":{\"return_verification\":true,\"detect_copy\":true,\"return_text_location\":true,\"detect_reproduce\":true},\"vehicle_license\":{\"return_issuing_authority\":true,\"return_text_location\":true},\"quota_invoice\":{},\"vat_invoice\":{\"advanced_mode\":true,\"return_text_location\":true},\"flight_itinerary\":{},\"transportation_license\":{},\"passport\":{},\"train_ticket\":{\"return_text_location\":true},\"bankcard\":{\"return_text_location\":true},\"driver_license\":{\"return_issuing_authority\":true,\"return_text_location\":true}}");
            body.withTypeList(listbodyTypeList);
            body.withImage("/9j/4AAQSkZJRgABAgEASABIAAD/4RFZRXhpZgAATU0AKgAAAA...");
            request.withBody(body);
            try {
                RecognizeAutoClassificationResponse response = client.recognizeAutoClassification(request);
                System.out.println(response.toString());
            } catch (ConnectionException e) {
                e.printStackTrace();
            } catch (RequestTimeoutException e) {
                e.printStackTrace();
            } catch (ServiceResponseException e) {
                e.printStackTrace();
                System.out.println(e.getHttpStatusCode());
                System.out.println(e.getRequestId());
                System.out.println(e.getErrorCode());
                System.out.println(e.getErrorMsg());
            }
        }
    }
    
  • 传入图片的url,进行图片分类和内容识别
     1
     2
     3
     4
     5
     6
     7
     8
     9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    package com.huaweicloud.sdk.test;
    
    import com.huaweicloud.sdk.core.auth.ICredential;
    import com.huaweicloud.sdk.core.auth.BasicCredentials;
    import com.huaweicloud.sdk.core.exception.ConnectionException;
    import com.huaweicloud.sdk.core.exception.RequestTimeoutException;
    import com.huaweicloud.sdk.core.exception.ServiceResponseException;
    import com.huaweicloud.sdk.ocr.v1.region.OcrRegion;
    import com.huaweicloud.sdk.ocr.v1.*;
    import com.huaweicloud.sdk.ocr.v1.model.*;
    
    
    public class RecognizeAutoClassificationSolution {
    
        public static void main(String[] args) {
            // The AK and SK used for authentication are hard-coded or stored in plaintext, which has great security risks. It is recommended that the AK and SK be stored in ciphertext in configuration files or environment variables and decrypted during use to ensure security.
            // In this example, AK and SK are stored in environment variables for authentication. Before running this example, set environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment
            String ak = System.getenv("CLOUD_SDK_AK");
            String sk = System.getenv("CLOUD_SDK_SK");
    
            ICredential auth = new BasicCredentials()
                    .withAk(ak)
                    .withSk(sk);
    
            OcrClient client = OcrClient.newBuilder()
                    .withCredential(auth)
                    .withRegion(OcrRegion.valueOf("<YOUR REGION>"))
                    .build();
            RecognizeAutoClassificationRequest request = new RecognizeAutoClassificationRequest();
            AutoClassificationRequestBody body = new AutoClassificationRequestBody();
            body.withUrl("https://BucketName.obs.myhuaweicloud.com/ObjectName");
            request.withBody(body);
            try {
                RecognizeAutoClassificationResponse response = client.recognizeAutoClassification(request);
                System.out.println(response.toString());
            } catch (ConnectionException e) {
                e.printStackTrace();
            } catch (RequestTimeoutException e) {
                e.printStackTrace();
            } catch (ServiceResponseException e) {
                e.printStackTrace();
                System.out.println(e.getHttpStatusCode());
                System.out.println(e.getRequestId());
                System.out.println(e.getErrorCode());
                System.out.println(e.getErrorMsg());
            }
        }
    }
    
  • 传入图片的base64编码,进行图片分类和内容识别
     1
     2
     3
     4
     5
     6
     7
     8
     9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    # coding: utf-8
    
    from huaweicloudsdkcore.auth.credentials import BasicCredentials
    from huaweicloudsdkocr.v1.region.ocr_region import OcrRegion
    from huaweicloudsdkcore.exceptions import exceptions
    from huaweicloudsdkocr.v1 import *
    
    if __name__ == "__main__":
        # The AK and SK used for authentication are hard-coded or stored in plaintext, which has great security risks. It is recommended that the AK and SK be stored in ciphertext in configuration files or environment variables and decrypted during use to ensure security.
        # In this example, AK and SK are stored in environment variables for authentication. Before running this example, set environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment
        ak = os.getenv("CLOUD_SDK_AK")
        sk = os.getenv("CLOUD_SDK_SK")
    
        credentials = BasicCredentials(ak, sk) \
    
        client = OcrClient.new_builder() \
            .with_credentials(credentials) \
            .with_region(OcrRegion.value_of("<YOUR REGION>")) \
            .build()
    
        try:
            request = RecognizeAutoClassificationRequest()
            listTypeListbody = [
                "vat_invoice",
                "train_ticket",
                "taxi_invoice"
            ]
            request.body = AutoClassificationRequestBody(
                extended_parameters="{\"toll_invoice\":{},\"mvs_invoice\":{},\"taxi_invoice\":{\"return_text_location\":true},\"id_card\":{\"return_verification\":true,\"detect_copy\":true,\"return_text_location\":true,\"detect_reproduce\":true},\"vehicle_license\":{\"return_issuing_authority\":true,\"return_text_location\":true},\"quota_invoice\":{},\"vat_invoice\":{\"advanced_mode\":true,\"return_text_location\":true},\"flight_itinerary\":{},\"transportation_license\":{},\"passport\":{},\"train_ticket\":{\"return_text_location\":true},\"bankcard\":{\"return_text_location\":true},\"driver_license\":{\"return_issuing_authority\":true,\"return_text_location\":true}}",
                type_list=listTypeListbody,
                image="/9j/4AAQSkZJRgABAgEASABIAAD/4RFZRXhpZgAATU0AKgAAAA..."
            )
            response = client.recognize_auto_classification(request)
            print(response)
        except exceptions.ClientRequestException as e:
            print(e.status_code)
            print(e.request_id)
            print(e.error_code)
            print(e.error_msg)
    
  • 传入图片的url,进行图片分类和内容识别
     1
     2
     3
     4
     5
     6
     7
     8
     9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    # coding: utf-8
    
    from huaweicloudsdkcore.auth.credentials import BasicCredentials
    from huaweicloudsdkocr.v1.region.ocr_region import OcrRegion
    from huaweicloudsdkcore.exceptions import exceptions
    from huaweicloudsdkocr.v1 import *
    
    if __name__ == "__main__":
        # The AK and SK used for authentication are hard-coded or stored in plaintext, which has great security risks. It is recommended that the AK and SK be stored in ciphertext in configuration files or environment variables and decrypted during use to ensure security.
        # In this example, AK and SK are stored in environment variables for authentication. Before running this example, set environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment
        ak = os.getenv("CLOUD_SDK_AK")
        sk = os.getenv("CLOUD_SDK_SK")
    
        credentials = BasicCredentials(ak, sk) \
    
        client = OcrClient.new_builder() \
            .with_credentials(credentials) \
            .with_region(OcrRegion.value_of("<YOUR REGION>")) \
            .build()
    
        try:
            request = RecognizeAutoClassificationRequest()
            request.body = AutoClassificationRequestBody(
                url="https://BucketName.obs.myhuaweicloud.com/ObjectName"
            )
            response = client.recognize_auto_classification(request)
            print(response)
        except exceptions.ClientRequestException as e:
            print(e.status_code)
            print(e.request_id)
            print(e.error_code)
            print(e.error_msg)
    
  • 传入图片的base64编码,进行图片分类和内容识别
     1
     2
     3
     4
     5
     6
     7
     8
     9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    package main
    
    import (
    	"fmt"
    	"github.com/huaweicloud/huaweicloud-sdk-go-v3/core/auth/basic"
        ocr "github.com/huaweicloud/huaweicloud-sdk-go-v3/services/ocr/v1"
    	"github.com/huaweicloud/huaweicloud-sdk-go-v3/services/ocr/v1/model"
        region "github.com/huaweicloud/huaweicloud-sdk-go-v3/services/ocr/v1/region"
    )
    
    func main() {
        // The AK and SK used for authentication are hard-coded or stored in plaintext, which has great security risks. It is recommended that the AK and SK be stored in ciphertext in configuration files or environment variables and decrypted during use to ensure security.
        // In this example, AK and SK are stored in environment variables for authentication. Before running this example, set environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment
        ak := os.Getenv("CLOUD_SDK_AK")
        sk := os.Getenv("CLOUD_SDK_SK")
    
        auth := basic.NewCredentialsBuilder().
            WithAk(ak).
            WithSk(sk).
            Build()
    
        client := ocr.NewOcrClient(
            ocr.OcrClientBuilder().
                WithRegion(region.ValueOf("<YOUR REGION>")).
                WithCredential(auth).
                Build())
    
        request := &model.RecognizeAutoClassificationRequest{}
    	var listTypeListbody = []string{
            "vat_invoice",
    	    "train_ticket",
    	    "taxi_invoice",
        }
    	var extendedParametersAutoClassificationRequestBody interface{} = "{\"toll_invoice\":{},\"mvs_invoice\":{},\"taxi_invoice\":{\"return_text_location\":true},\"id_card\":{\"return_verification\":true,\"detect_copy\":true,\"return_text_location\":true,\"detect_reproduce\":true},\"vehicle_license\":{\"return_issuing_authority\":true,\"return_text_location\":true},\"quota_invoice\":{},\"vat_invoice\":{\"advanced_mode\":true,\"return_text_location\":true},\"flight_itinerary\":{},\"transportation_license\":{},\"passport\":{},\"train_ticket\":{\"return_text_location\":true},\"bankcard\":{\"return_text_location\":true},\"driver_license\":{\"return_issuing_authority\":true,\"return_text_location\":true}}"
    	imageAutoClassificationRequestBody:= "/9j/4AAQSkZJRgABAgEASABIAAD/4RFZRXhpZgAATU0AKgAAAA..."
    	request.Body = &model.AutoClassificationRequestBody{
    		ExtendedParameters: &extendedParametersAutoClassificationRequestBody,
    		TypeList: &listTypeListbody,
    		Image: &imageAutoClassificationRequestBody,
    	}
    	response, err := client.RecognizeAutoClassification(request)
    	if err == nil {
            fmt.Printf("%+v\n", response)
        } else {
            fmt.Println(err)
        }
    }
    
  • 传入图片的url,进行图片分类和内容识别
     1
     2
     3
     4
     5
     6
     7
     8
     9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    package main
    
    import (
    	"fmt"
    	"github.com/huaweicloud/huaweicloud-sdk-go-v3/core/auth/basic"
        ocr "github.com/huaweicloud/huaweicloud-sdk-go-v3/services/ocr/v1"
    	"github.com/huaweicloud/huaweicloud-sdk-go-v3/services/ocr/v1/model"
        region "github.com/huaweicloud/huaweicloud-sdk-go-v3/services/ocr/v1/region"
    )
    
    func main() {
        // The AK and SK used for authentication are hard-coded or stored in plaintext, which has great security risks. It is recommended that the AK and SK be stored in ciphertext in configuration files or environment variables and decrypted during use to ensure security.
        // In this example, AK and SK are stored in environment variables for authentication. Before running this example, set environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment
        ak := os.Getenv("CLOUD_SDK_AK")
        sk := os.Getenv("CLOUD_SDK_SK")
    
        auth := basic.NewCredentialsBuilder().
            WithAk(ak).
            WithSk(sk).
            Build()
    
        client := ocr.NewOcrClient(
            ocr.OcrClientBuilder().
                WithRegion(region.ValueOf("<YOUR REGION>")).
                WithCredential(auth).
                Build())
    
        request := &model.RecognizeAutoClassificationRequest{}
    	urlAutoClassificationRequestBody:= "https://BucketName.obs.myhuaweicloud.com/ObjectName"
    	request.Body = &model.AutoClassificationRequestBody{
    		Url: &urlAutoClassificationRequestBody,
    	}
    	response, err := client.RecognizeAutoClassification(request)
    	if err == nil {
            fmt.Printf("%+v\n", response)
        } else {
            fmt.Println(err)
        }
    }
    

更多编程语言的SDK代码示例,请参见API Explorer的代码示例页签,可生成自动对应的SDK代码示例。

状态码

状态码

描述

200

成功响应示例

400

失败响应示例

状态码请参见状态码

错误码

错误码请参见错误码

相关文档