API概览
通过使用文字识别服务的自研API,您可以使用文字识别服务的所有功能,如表1所示。
文字识别服务当前支持通用类、证件类、票据类和智能分类四种不同类型的接口。您可以通过在线体验,体验接口的识别效果。
对于固定板式的图片,如果当前接口不满足您的业务需求,可以使用ModelArts Pro服务提供的文字识别套件,零代码搭建出专属的API,详细操作请参见视频指导。
服务部署区域是从地理位置和网络时延维度划分,同一个区域内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。一般情况下,建议就近选择靠近您或者您的目标用户的区域,这样可以减少网络时延,提高访问速度。对于OCR服务,不同的区域之间资源包不互通,请根据您的实际需求慎重选择。
类别 |
API |
说明 |
---|---|---|
智能文档解析 |
对证件、票据、表单等任意版式文档进行键值对提取、文字识别、以及表格识别等任务,实现进阶高效的自动化结构化返回。 |
|
通用类 |
识别表格图片上的文字内容,并返回识别的结构化结果。 |
|
识别图片上的文字内容,并返回识别的文字和坐标。 |
||
识别网络图片中的文字内容,并以JSON格式返回识别的结构化结果。支持横向、竖向、艺术字识别。 |
||
检测定位图片上指定要识别的票证(票据、证件或其他文字载体),并以JSON格式返回识别的结构化结果。 |
||
识别手写文字图片中的文字内容。 |
||
证件类 |
识别身份证图片中正面与反面的文字内容,并返回识别的文字和坐标。 |
|
识别户口本中的文字信息,并返回识别的结构化结果。 |
||
识别行驶证图片中主页与副页的文字内容,并返回识别的文字和坐标。 |
||
识别驾驶证图片中主页与副页的文字内容,并返回识别的文字和坐标。 |
||
识别护照首页图片中的文字信息,并以JSON格式返回识别的结构化结果。 |
||
识别银行卡上的关键文字信息,并以JSON格式返回识别的结构化结果。 |
||
识别营业执照首页图片中的文字信息,并以JSON格式返回识别的结构化结果。 |
||
识别道路运输证首页中的文字信息,并以JSON格式返回识别的结构化结果。 |
||
识别车牌图片中的车牌信息,并返回其坐标和内容。 |
||
识别名片图片上的文字信息,并返回识别的结构化结果。支持对多种不同版式名片进行结构化信息提取。 |
||
识别图片中的车架号信息,并将识别结果返回给用户。 |
||
识别用户上传的电子面单图片中的文字内容,并将识别的结果返回给用户。 |
||
识别道路运输从业资格证上的关键文字信息,并返回识别的结构化结果。 |
||
识别泰国身份证中的文字信息,并以JSON格式返回识别的结构化结果。 |
||
识别不动产证中的文字信息,并返回识别的结构化结果。 |
||
识别车辆合格证中的文字信息,并返回识别的结构化结果。 |
||
识别哥伦比亚身份证中的文字信息,并将识别的结构化结果返回给用户。 |
||
票据类 |
识别增值税发票图片中的文字内容,并返回识别的结构化结果。 |
|
支持10种增值税发票的信息核验。 |
||
识别机动车销售发票图片中的文字内容,并返回识别的结构化结果。 |
||
识别出租车发票中的文字信息,并以JSON格式返回识别的结构化结果。 |
||
识别火车票中的文字信息,并以JSON格式返回识别的结构化结果 |
||
识别定额发票中的文字信息,并以JSON格式返回识别的结构化结果。 |
||
识别车辆通行费发票中的关键文字信息,并以JSON格式返回识别的结构化结果。 |
||
识别飞机行程单中的文字信息,并以JSON格式返回识别的结构化结果。 |
||
识别用户上传的表格图片中的文字内容,并将识别的结果返回给用户。 |
||
识别承兑汇票识别中的关键字段, 并以json格式返回结构化结果。 |
||
支持对银行回单版式进行文字识别及键值对提取,实现高效的自动化结构化返回。 |
||
行业类 |
识别保险单图片上的文字信息,并将识别的结构化结果返回给用户。支持对多板式保险单的扫描图片及手机照片进行结构化信息提取。 |
|
识别防疫健康码中的姓名、健康码更新时间、健康码颜色,并将识别的结构化结果返回给用户。 |
||
支持对全国各地不同版式的核酸检测记录中的4个关键字段进行结构化识别,包括姓名、核酸检测采样时间、检测检测结果更新时间、核酸检测结果(阳性、阴性、未知)。 |
||
自定义模板 |
自定义模板OCR,支持用户自定义模板,对于版式固定的各种票据和卡证,通过可视化界面操作,指定需要识别的关键字段,实现用户特定格式图片的自动识别和结构化提取。 |