最新动态

更新时间:2024/11/05 GMT+08:00
分享

本文介绍了文字识别 OCR各特性版本的功能发布和对应的文档动态,欢迎体验。

2024年11月

序号

功能名称

功能描述

阶段

相关文档

1

发票验真支持检测航空运输电子客票行程单

OCR发票验真新增对全电发票(航空运输电子客票行程单)的检测,调用接口可返回行程单发票中记录的航空运输过程中客户所支付的费用和服务信息。

商用

发票验真

2

智能文档解析新增入参language可进行多语言识别

智能文档解析功能新增了请求参数language,此参数允许用户指定待识别图片的语言,可识别中英文以及部分繁体字、马来语、乌克兰语、印地语、俄语等多种语言文字。

商用

智能文档解析

2024年08月

序号

功能名称

功能描述

阶段

相关文档

1

智能文档解析新增入参single_orientation_mode

智能文档解析新增入参single_orientation_mode,单朝向模式开关。可选值包括:true:打开单朝向模式,false:关闭单朝向模式。未传入该参数时默认为false,即默认图片中的字段为多朝向

商用

智能文档解析

2024年07月

序号

功能名称

功能描述

阶段

相关文档

1

通用文字识别新增识别语种希伯来语

通用文字识别新增识别语种,支持识别希伯来语。

商用

通用文字识别

2024年06月

序号

功能名称

功能描述

阶段

相关文档

1

自定义模版发布停售公告

华为云计划于2024/07/05 00:00(北京时间)正式停售OCR文字识别服务北京四、上海一、北京一的自定义模版。

商用

【停售公告】OCR自定义模板停售公告

2024年05月

序号

功能名称

功能描述

阶段

相关文档

1

智能文档解析新增入参pdf_page_number

智能文档解析新增入参pdf_page_number,支持指定PDF页码识别。传入该参数时,则识别指定页码的内容。如果不传该参数,则默认识别第1页。

商用

智能文档解析

2024年04月

序号

功能名称

功能描述

阶段

相关文档

1

华北-北京四新增银行回单识别

华北-北京四新增银行回单识别,自动识别100+不同版式银行回单的全部信息,包括付款人、收款人相关账号、金额及交易信息等。

商用

银行回单识别

2

华北-北京四新增户口本识别

华北-北京四新增户口本识别,自动识别居民户口本户主页及成员页,并返回部分关键字段信息。

商用

户口本识别

3

营业执照API新增出参organization_form

营业执照API新增出参organization_form,支持横版(新版)营业执照识别。

商用

营业执照识别

4

智能文档解析API新增入参formula,出参formula_result公式识别结果

智能文档解析API新增入参formula,出参formula_result,支持公式识别,识别结果为latex序列。当前仅支持文档(例如:论文)中的公式识别,不支持公式切片图像。

商用

智能文档解析

2024年03月

序号

功能名称

功能描述

阶段

相关文档

1

泰国车牌识别API新增province字段

泰国车牌识别API新增province字段,支持识别车牌所属府。

商用

泰国车牌识别

2

智能文档解析API新增入参form,出参form_result相关字段

智能文档解析API新增入参form,出参form_result相关字段,支持用户设置是否进行有线表单识别。有线表单指关键信息以有线单元格形式进行呈现,例如户口本、机动车发票等。若是,结果会以"form_result"这一关键字返回。

商用

智能文档解析

3

新增拉美-墨西哥城二Region,支持哥伦比亚身份证购买

新增拉美-墨西哥城二Region,支持哥伦比亚身份证购买。

商用

终端节点

4

身份证识别新增入参return_portrait_image、return_adjusted_image和响应参数portrait_image、adjusted_image

身份证识别新增入参return_portrait_image、return_adjusted_image和响应参数portrait_image、adjusted_image,支持返回头像图片信息(base64码)和返回身份证卡面(base64码)。

商用

身份证识别

5

通用文字识别新增支持语言:柬埔寨语识别

通用文字识别新增支持语言:柬埔寨语识别。

商用

通用文字识别

2024年02月

序号

功能名称

功能描述

阶段

相关文档

1

火车票识别新增3种支持类型

火车票识别在原有的纸质火车票识别基础上新增3种支持类型:电子发票、旧版退票凭证、新版退票凭证。

商用

火车票识别

2024年01月

序号

功能名称

功能描述

阶段

相关文档

1

智能分类识别新增4种支持票证类型

智能分类识别新增4种支持票证类型:车船票、网约车行程单、通用机打发票和增值税发票销货清单。

商用

智能分类识别

2

身份证识别新增支持身份证PS、模糊、反光等告警功能,且支持居民身份证的正反面同时识别

新增支持身份证PS、模糊、反光、边框完整性、边框内异物遮挡、复印件和临时身份证告警功能,且支持居民身份证的正反面同时识别,不支持存在两张及以上同面身份证的图片识别。

商用

身份证识别

3

亚太-曼谷新增泰国车牌识别

识别泰国车牌图片中的车牌信息,返回识别结果和车牌的区域位置信息。

商用

泰国车牌识别

4

OCR华北-北京4新增印章识别

检测和识别合同文件或常用票据中的印章,并可擦除和提取图片中的印章,通过JSON格式返回印章检测、识别、擦除和提取的结果。

商用

印章识别

5

飞机行程单识别新增tax、tax_rate、buyer_name等响应参数

飞机行程单识别新增响应参数:tax、tax_rate、buyer_name、buyer_id、number、international_flag、issue_status。

商用

飞机行程单识别

2023年11月

序号

功能名称

功能描述

阶段

相关文档

1

身份证识别新增入参return_portrait_location和响应参数portrait_location

身份证识别新增入参return_portrait_location和响应参数portrait_location,支持返回身份证回头像位置信息。

商用

身份证识别

2

通用文字识别新增支持4门语言:土耳其语、挪威语、丹麦语、瑞典语识别

通用文字识别新增支持4门语言:土耳其语、挪威语、丹麦语、瑞典语识别。

商用

通用文字识别

2023年10月

序号

功能名称

功能描述

阶段

相关文档

1

网络图片识别新增入参detect_text_direction

网络图片新增入参detect_text_direction,支持检测每个字段的文字方向。

商用

网络图片识别

2

OCR圣地亚哥Region新增哥伦比亚身份证识别

新增哥伦比亚身份证。识别哥伦比亚身份证中的文字信息,并将识别的结构化结果返回给用户。

商用

哥伦比亚身份证识别

3

通用表格识别新增入参with_borders

通用表格新增入参with_borders,支持有线表格与无线表格识别。

商用

通用表格识别

2023年09月

序号

功能名称

功能描述

阶段

相关文档

1

OCR华北-北京4新增车辆合格证识别

支持车辆合格证识别,识别车辆合格证中的文字信息,并返回识别的结构化结果。

商用

车辆合格证识别

2

OCR华北-北京4和广州Region新增承兑汇票识别

支持承兑汇票识别。识别承兑汇票识别中的关键字段, 并以json格式返回结构化结果。

商用

承兑汇票识别

3

OCR华北-北京4和广州Region新增不动产证识别

新增不动产证识别。识别不动产证中的文字信息,并返回识别的结构化结果。

商用

不动产证识别

2023年08月

序号

功能名称

功能描述

阶段

相关文档

1

OCR华北-北京4Region新增智能文档解析

支持智能文档解析,对证件、票据、表单等任意版式文档进行键值对提取、文字识别、以及表格识别等任务,实现进阶高效的自动化结构化返回。

商用

智能文档解析

2023年07月

序号

功能名称

功能描述

阶段

相关文档

1

中国站帐号支持开通泰文身份证识别API

中国站帐号支持开通泰文身份证识别API,可在中国站的曼谷局点开通服务并调用。

商用

泰文身份证识别

2023年06月

序号

功能名称

功能描述

阶段

相关文档

1

车牌识别API支持识别大型新能源车型

车牌识别API支持识别大型新能源车型,对应的plate_color参数返回值为yellow_green。

商用

车牌识别

2023年05月

序号

功能名称

功能描述

阶段

相关文档

1

OCR支持用户自定义模板

支持用户自定义模板,对于版式固定的各种票据和卡证,通过可视化界面、API进行识别。

商用

自定义OCR

2

智能分类识别API支持全电发票

智能分类识别API支持全电发票。接口会返回图片上要识别全电发票的位置坐标、结构化识别的内容以及对应的类别。

商用

智能分类识别

2023年04月

序号

功能名称

功能描述

阶段

相关文档

1

财务报表识别API支持通过透视变换矩阵计算文字在原图的坐标

财务报表识别API支持通过设置return_rectification_matrix参数,返回透视变换矩阵。可用于计算文字在原图中的坐标。

商用

财务报表识别

2023年03月

序号

功能名称

功能描述

阶段

相关文档

1

OCR增值税发票识别,支持全电发票

OCR增值税发票识别API,支持识别全电普通发票、全电专用发票。

商用

增值税发票识别

2023年01月

序号

功能名称

功能描述

阶段

相关文档

1

通用表格识别API支持通过透视变换矩阵计算文字在原图的坐标

OCR通用表格识别API支持通过设置return_rectification_matrix参数,返回透视变换矩阵。可用于计算文字在原图中的坐标。

商用

通用表格识别

2

通用文字识别API支持马来语、乌克兰语、印地语…识别功能

OCR通用文字识别API支持中英文以及部分繁体字、马来语、乌克兰语、印地语、俄语、越南语、印尼语、泰语识别。

商用

通用文字识别

2022年11月

序号

功能名称

功能描述

阶段

相关文档

1

发票验真API支持查验全电发票的信息

OCR发票验真API支持对全电发票(全面数据化电子发票)的内容进行查验。发票验真对接国税局,保证内容查验的真实性和有效性。

商用

发票验真

2

OCR北京一、北京四、上海一区域API支持按企业项目分账

OCR北京一、北京四、上海一区域部署的API支持企业项目管理,可按不同企业项目分别进行财务统计。企业项目之间相互独立,资源分开结算。

商用

企业项目管理

2022年10月

序号

功能名称

功能描述

阶段

相关文档

1

OCR上海一region上线发票、证件类识别API

OCR上海一region上线增值税发票识别、通用文字识别、营业执照识别、车牌识别、道路运输从业资格证识别。

商用

终端节点

2

通用文字识别API支持单字符检测功能

通用文字识别API支持检测单个文本行的单字符信息。

商用

通用文字识别

2022年09月

序号

功能名称

功能描述

阶段

相关文档

1

健康码、核酸检测记录、行程卡三合一检测API上线

OCR防疫健康码识别API支持同时检测健康码、核酸检测记录、行程卡。只需调用1个API即可实现对姓名、健康码颜色、核酸检测结果、核酸采样时间等内容的识别。

商用

防疫健康码识别

2022年08月

序号

功能名称

功能描述

阶段

相关文档

1

OCR上海一Region新增保险单识别、机动车销售发票识别、道路运输证识别

OCR上海一区域新增保险单识别、机动车销售发票识别、道路运输证识别服务,请您根据业务需要选择对应区域的终端节点。

商用

OCR终端节点

2

OCR支持企业项目管理,支持不同企业项目分别进行财务统计

OCR支持通过企业项目管理(EPS)对不同用户组和用户的资源使用进行分账。企业可以根据组织架构规划不同的企业项目,并为每个企业项目设置拥有不同权限的用户组和用户,多个企业项目之间相互独立,资源分开结算。

商用

企业项目管理

3

网络图片识别支持字体类型检测、支持竖行文本识别、支持多朝向文本识别。

网络图片识别,支持市面上大部分常见字体类型的检测(含商用需授权字体)、支持竖行文本识别、支持多朝向文本识别。

商用

网络图片识别API文档

4

身份证识别新增翻拍告警功能

身份证识别风险检测能力提升,新增翻拍告警功能。当输入参数detect_reproduce为true时,将返回翻拍告警结果,其中返回结果“true”表示是翻拍,“false”表示未经过翻拍。

商用

身份证识别API文档

2022年07月

序号

功能名称

功能描述

阶段

相关文档

1

增值税发票识别服务升级,type字段新增"special_electronic"返回类型

服务升级前,"增值税电子普通发票"和"增值税电子专用发票"统一归为electronic类型;服务升级后,"增值税电子普通发票"仍返回electronic类型,"增值税电子专用发票"将会归类为新的special_electronic类型。

商用

增值税发票识别API文档

2022年05月

序号

功能名称

功能描述

阶段

相关文档

1

OCR上线核酸检测记录API

支持对全国各地不同版式的核酸检测记录中的4个关键字段进行结构化识别,包括姓名、核酸检测采样时间、检测检测结果更新时间、核酸检测结果(阳性、阴性、未知)。

商用

核酸检测记录API

2

OCR上线防疫健康码识别API

识别防疫健康码中的姓名、健康码更新时间、健康码颜色,并将识别的结构化结果返回给用户。

商用

防疫健康码识别API接口

2022年03月

序号

功能名称

功能描述

阶段

相关文档

1

OCR上线细粒度授权功能

OCR支持细粒度授权功能上线,新增支持对OCR服务取消开通,新增支持OCR服务细粒度授权,主账号可通过该特性对IAM子用户的调用权限进行控制。

商用

细粒度授权文档

2

出租车发票识别、行驶证识别、火车票识别、银行卡识别新增支持返回字段位置信息

出租车发票识别、行驶证识别、火车票识别、银行卡识别新增支持返回字段位置信息,新增输入参数:return_text_location,新增输出字段:text_location,方便用户进行版式的二次处理,以及提高人工校验效率。

商用

出租车发票识别API接口

行驶证识别API接口

火车票识别API接口

银行卡识别API接口

3

增值税发票识别,增加print_code,print_number及文本框坐标字段

增值税发票识别,新增输入参数: return_text_location,新增输出字段:print_code,print_number,text_location。

商用

增值税发票识别API接口文档

4

身份证识别,返回结果携带坐标参数

身份证识别,返回结果新增text_location参数,返回识别到的文字块的区域位置信息。方便用户进行版式的二次处理,以及提高人工校验效率。

商用

身份证识别API说明

5

增值税发票识别,新增支持识别PDF、OFD文档

增值税发票识别,新增支持识别PDF、OFD文件,现共支持JPEG、JPG、PNG、BMP、TIFF、PDF、OFD格式,多页PDF仅识别第一页。

商用

增值税发票识别API接口

2022年02月

序号

功能名称

功能描述

阶段

相关文档

1

新增电子驾驶证识别功能

驾驶证识别,现已支持电子驾驶证、纸质驾驶证的识别,您可根据使用场景选择对应的驾驶证类型。

商用

驾驶证识别API文档

2021年12月

序号

功能名称

功能描述

阶段

相关文档

1

上线道路运输从业资格证识别

识别道路运输从业资格证上的关键文字信息,并返回识别的结构化结果。

商用

道路运输从业资格证识别

2021年10月

序号

功能名称

功能描述

阶段

相关文档

1

上线财务报表识别

识别用户上传的财报表格图片中的文字内容,并将识别的结果返回给用户。

商用

财务报表识别

2

上线保险单识别

识别保险单图片上的文字信息,并将识别的结构化结果返回给用户。支持对多板式保险单的扫描图片及手机照片进行结构化信息提取。

商用

保险单识别

2021年09月

序号

功能名称

功能描述

阶段

相关文档

1

新增发票验真功能

支持9种增值税发票的信息核验。

商用

发票验真

2021年08月

序号

功能名称

功能描述

阶段

相关文档

1

身份证识别功能优化

支持校验身份证号等信息: 身份证号合法性 身份证号与出生日期一致性 身份证号与性别一致性 当前日期是否在有效期内

商用

身份证识别

2021年06月

序号

功能名称

功能描述

阶段

相关文档

1

道路运输证服务优化,支持电子版证件识别

道路运输证识别服务精度优化,新增支持电子版证件识别

商用

道路运输证识别

2021年01月

序号

功能名称

功能描述

阶段

相关文档

1

营业执照识别功能优化

营业执照性能优化30%,支持大图识别。

商用

营业执照识别

2020年12月

序号

功能名称

功能描述

阶段

相关文档

1

飞机行程单识别功能优化

飞机行程单识别服务精度优化,支持不同场景下图片的识别。

商用

飞机行程单识别

2

接口更新

线上服务请求URI由v1.0接口统一切换成v2接口,例如通用文字识别URI由/v1.0/ocr/general-text更新成/v2/{project_id}/ocr/general-text。 原有的v1.0接口任然可以正常使用。

商用

API参考

2020年10月

序号

功能名称

功能描述

阶段

相关文档

1

增加服务部署区域

身份证、驾驶证、行驶证、银行卡、通用表格识别服务上线上海一区域。

商用

终端节点

2020年09月

序号

功能名称

功能描述

阶段

相关文档

1

文字识别控制台优化

在服务监控可视化界面增加各时间段查询功能。 新增套餐包管理界面查询方式(按时间查询、模糊查询等)。

商用

OCR服务控制台

2020年08月

序号

功能名称

功能描述

阶段

相关文档

1

文字识别控制台更新

文字识别服务管理控制台更新: 增加左侧菜单栏:总览、套餐包管理、服务监控、调用指南等功能。 优化服务授权、服务开通、套餐包购买、产品展示等功能和使用。 新增常用链接、快速入门、常见问题、问题分类等专栏链接。 服务监控推出可视化界面。 新增API调用、SDK调用等使用说明。

商用

OCR服务控制台

2

银行卡识别功能优化

银行卡识别服务优化竖版银行卡识别精度。

商用

银行卡识别

2020年07月

序号

功能名称

功能描述

阶段

相关文档

1

行驶证、驾驶证功能优化

行驶证、驾驶证识别服务增加返回发证机关功能。

商用

行驶证识别

驾驶证识别

2020年06月

序号

功能名称

功能描述

阶段

相关文档

1

新增VIN码识别、名片识别

VIN码识别:可以识别图片中的车架号信息,并将识别结果返回给用户。 名片识别:可以识别图片中的文字信息,并返回识别的结构化结果,支持对多种不同板式名片进行结构化信息提取。

商用

VIN码识别

名片识别

2020年04月

序号

功能名称

功能描述

阶段

相关文档

1

上线名片识别、VIN码识别

识别图片上的名片内容、车架号信息。名片识别支持对多种不同板式名片进行结构化信息提取。

商用

名片识别

VIN码识别

2

护照识别功能优化

护照识别服务性能提升8%。

商用

护照识别

2020年03月

序号

功能名称

功能描述

阶段

相关文档

1

移动端界面适配

华为云移动端控制台界面适配,支持移动端便捷购买套餐包。

商用

计费说明

2

价格更新

OCR线上服务降价50%。

商用

计费说明

3

行驶证识别功能优化

行驶证识别服务支持新能源车牌号码识别。

商用

行驶证识别

4

网络图片识别功能优化

网络图片识别服务性能提升1倍。

商用

网络图片识别

5

通用表格识别功能优化

通用表格识别服务精度优化,新增入参 return_text_location,支持文本和单元格的坐标返回。

商用

通用表格识别

2020年02月

序号

功能名称

功能描述

阶段

相关文档

1

车牌识别功能优化

车牌识别服务支持不同场景下图片的识别,精度提升。

商用

车牌识别

2019年10月

序号

功能名称

功能描述

阶段

相关文档

1

新增《快速入门》文档

使用SDK调用OCR服务 使用Postman调用OCR服务

商用

文字识别快速入门

2019年09月

序号

功能名称

功能描述

阶段

相关文档

1

文字识别控制台全新风格改版,更简洁易用

增加对象存储服务OBS授权功能。OCR服务功能菜单调整至左侧,统一风格,更多细节优化,全新界面,全新体验。

商用

OCR服务控制台

2

新增智能分类识别

智能分类识别:可以一次性对同张图片中的多个卡证、票据进行检测和识别,并返回每个卡证、票据的类别和结构化数据。

商用

智能分类识别

2019年07月

序号

功能名称

功能描述

阶段

相关文档

1

新增火车票识别、银行卡识别、营业执照识别

火车票识别:识别火车票中的文字信息,并返回识别的结构化结果。 银行卡识别:识别银行卡上的关键文字信息,并返回识别的结构化结果。 营业执照识别:识别营业执照图片中的文字信息,并返回识别的结构化结果。

商用

火车票识别

银行卡识别

营业执照识别

2

新增车辆通行费发票识别、飞机行程单识别、定额发票识别

车辆通行费发票识别:识别车辆通行费中的关键文字信息,并返回识别的结构化结果。 飞机行程单识别:识别飞机行程单中的文字信息,并返回识别的结构化结果。 定额发票识别:识别定额发票中的文字信息,并返回识别的结构化结果。

商用

车辆通行费发票识别

飞机行程单识别

定额发票识别

3

新增网络图片识别、出租车发票识别

网络图片识别:识别网络图片中的文字内容,并返回识别的结构化结果。 出租车发票识别:识别出租车发票中的文字信息,并返回识别的结构化结果。

商用

网络图片识别

出租车发票识别

4

新增护照识别、道路运输证识别

护照识别:识别护照图片中的文字信息,并返回识别的结构化结果。 道路运输证识别:识别道路运输证中的文字信息,并返回识别的结构化结果。

商用

护照识别

道路运输证识别

2018年09月

序号

功能名称

功能描述

阶段

相关文档

1

新增《使用前必读》文档

介绍调用API的流程和注意事项。

商用

API使用前必读

2017年11月

序号

功能名称

功能描述

阶段

相关文档

1

文字识别服务上线

文字识别(Optical Character Recognition,简称OCR)是指对图像文件的打印字符进行检测识别,将图像中的文字转换成可编辑的文本格式,以JSON格式返回识别结果。

商用

文字识别

相关文档