更新时间:2025-12-03 GMT+08:00
分享

API概览

通过使用文字识别服务的自研API,您可以使用文字识别服务的所有功能,如表1所示。

文字识别服务当前支持通用类、证件类、票据类和智能分类四种不同类型的接口。您可以通过在线体验,体验接口的识别效果。

服务部署区域是从地理位置和网络时延维度划分,同一个区域内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。一般情况下,建议就近选择靠近您或者您的目标用户的区域,这样可以减少网络时延,提高访问速度。对于OCR服务,不同的区域之间资源包不互通,请根据您的实际需求慎重选择。

表1 接口说明

类别

API

说明

智能文档解析

智能文档解析 - RecognizeSmartDocumentRecognizer

对证件、票据、表单等任意版式文档进行键值对提取、文字识别、以及表格识别等任务,实现进阶高效的自动化结构化返回。

通用类

通用表格识别 - RecognizeGeneralTable

识别表格图片上的文字内容,并返回识别的结构化结果。

通用文字识别 - RecognizeGeneralText

识别图片上的文字内容,并返回识别的文字和坐标。

网络图片识别 - RecognizeWebImage

识别网络图片中的文字内容,并以JSON格式返回识别的结构化结果。支持横向、竖向、艺术字识别。

智能分类识别 - RecognizeAutoClassification

检测定位图片上指定要识别的票证(票据、证件或其他文字载体),并以JSON格式返回识别的结构化结果。

手写文字识别 - RecognizeHandwriting

识别手写文字图片中的文字内容。

证件类

身份证识别 - RecognizeIdCard

识别身份证图片中正面与反面的文字内容,并返回识别的文字和坐标。

户口本识别 - RecognizeHouseholdRegister

识别户口本中的文字信息,并返回识别的结构化结果。

行驶证识别 - RecognizeVehicleLicense

识别行驶证图片中主页与副页的文字内容,并返回识别的文字和坐标。

驾驶证识别 - RecognizeDriverLicense

识别驾驶证图片中主页与副页的文字内容,并返回识别的文字和坐标。

护照识别 - RecognizePassport

识别护照首页图片中的文字信息,并以JSON格式返回识别的结构化结果。

银行卡识别 - RecognizeBankcard

识别银行卡上的关键文字信息,并以JSON格式返回识别的结构化结果。

营业执照识别 - RecognizeBusinessLicense

识别营业执照首页图片中的文字信息,并以JSON格式返回识别的结构化结果。

道路运输证识别 - RecognizeQualificationCertificate

识别道路运输证首页中的文字信息,并以JSON格式返回识别的结构化结果。

车牌识别 - RecognizeLicensePlate

识别车牌图片中的车牌信息,并返回其坐标和内容。

名片识别 - RecognizeBusinessCard

识别名片图片上的文字信息,并返回识别的结构化结果。支持对多种不同版式名片进行结构化信息提取。

VIN码识别 - RecognizeVin

识别图片中的车架号信息,并将识别结果返回给用户。

电子面单识别 - RecognizeWaybillElectronic

识别用户上传的电子面单图片中的文字内容,并将识别的结果返回给用户。

道路运输从业资格证识别 - RecognizeTransportationLicense

识别道路运输从业资格证上的关键文字信息,并返回识别的结构化结果。

泰文身份证识别 - RecognizeThailandIdcard

识别泰国身份证中的文字信息,并以JSON格式返回识别的结构化结果。

不动产证识别 - RecognizeRealEstateCertificate

识别不动产证中的文字信息,并返回识别的结构化结果。

车辆合格证识别 - RecognizeVehicleCertificate

识别车辆合格证中的文字信息,并返回识别的结构化结果。

哥伦比亚身份证识别 - RecognizeColombiaIdCard

识别哥伦比亚身份证中的文字信息,并将识别的结构化结果返回给用户。

票据类

增值税发票识别 - RecognizeVatInvoice

识别增值税发票图片中的文字内容,并返回识别的结构化结果。

发票验真 - RecognizeInvoiceVerification

支持10种增值税发票的信息核验。

机动车销售发票识别 - RecognizeMvsInvoice

识别机动车销售发票图片中的文字内容,并返回识别的结构化结果。

出租车发票识别 - RecognizeTaxiInvoice

识别出租车发票中的文字信息,并以JSON格式返回识别的结构化结果。

火车票识别 - RecognizeTrainTicket

识别火车票中的文字信息,并以JSON格式返回识别的结构化结果

定额发票识别 - RecognizeQuotaInvoice

识别定额发票中的文字信息,并以JSON格式返回识别的结构化结果。

车辆通行费发票识别 - RecognizeTollInvoice

识别车辆通行费发票中的关键文字信息,并以JSON格式返回识别的结构化结果。

飞机行程单识别 - RecognizeFlightItinerary

识别飞机行程单中的文字信息,并以JSON格式返回识别的结构化结果。

财务报表识别 - RecognizeFinancialStatement

识别用户上传的表格图片中的文字内容,并将识别的结果返回给用户。

承兑汇票识别 - RecognizeAcceptanceBill

识别承兑汇票识别中的关键字段, 并以json格式返回结构化结果。

银行回单识别 - RecognizeBankReceipt

支持对银行回单版式进行文字识别及键值对提取,实现高效的自动化结构化返回。

行业类

保险单识别 - RecognizeInsurancePolicy

识别保险单图片上的文字信息,并将识别的结构化结果返回给用户。支持对多板式保险单的扫描图片及手机照片进行结构化信息提取。

自定义模板

自定义模板OCR - RecognizeCustomTemplate

自定义模板OCR,支持用户自定义模板,对于版式固定的各种票据和卡证,通过可视化界面操作,指定需要识别的关键字段,实现用户特定格式图片的自动识别和结构化提取。

相关文档