最新动态

更新时间:2024/08/09 GMT+08:00
分享

本文介绍了文字识别 OCR各特性版本的功能发布和对应的文档动态,欢迎体验。

2024年08月

序号

功能名称

功能描述

阶段

相关文档

1

智能文档解析新增入参single_orientation_mode

智能文档解析新增入参single_orientation_mode,单朝向模式开关。可选值包括:true:打开单朝向模式,false:关闭单朝向模式。未传入该参数时默认为false,即默认图片中的字段为多朝向

商用

智能文档解析

2024年07月

序号

功能名称

功能描述

阶段

相关文档

1

通用文字识别新增识别语种希伯来语

通用文字识别新增识别语种,支持识别希伯来语。

商用

通用文字识别

2024年06月

序号

功能名称

功能描述

阶段

相关文档

1

自定义模版发布停售公告

华为云计划于2024/07/05 00:00(北京时间)正式停售OCR文字识别服务北京四、上海一、北京一的自定义模版。

商用

【停售公告】OCR自定义模板停售公告

2024年05月

序号

功能名称

功能描述

阶段

相关文档

1

智能文档解析新增入参pdf_page_number

智能文档解析新增入参pdf_page_number,支持指定PDF页码识别。传入该参数时,则识别指定页码的内容。如果不传该参数,则默认识别第1页。

商用

智能文档解析

2024年04月

序号

功能名称

功能描述

阶段

相关文档

1

华北-北京四新增银行回单识别

华北-北京四新增银行回单识别,自动识别100+不同版式银行回单的全部信息,包括付款人、收款人相关账号、金额及交易信息等。

商用

银行回单识别

2

华北-北京四新增户口本识别

华北-北京四新增户口本识别,自动识别居民户口本户主页及成员页,并返回部分关键字段信息。

商用

户口本识别

3

营业执照API新增出参organization_form

营业执照API新增出参organization_form,支持横版(新版)营业执照识别。

商用

营业执照识别

4

智能文档解析API新增入参formula,出参formula_result公式识别结果

智能文档解析API新增入参formula,出参formula_result,支持公式识别,识别结果为latex序列。当前仅支持文档(例如:论文)中的公式识别,不支持公式切片图像。

商用

智能文档解析

2024年03月

序号

功能名称

功能描述

阶段

相关文档

1

泰国车牌识别API新增province字段

泰国车牌识别API新增province字段,支持识别车牌所属府。

商用

泰国车牌识别

2

智能文档解析API新增入参form,出参form_result相关字段

智能文档解析API新增入参form,出参form_result相关字段,支持用户设置是否进行有线表单识别。有线表单指关键信息以有线单元格形式进行呈现,例如户口本、机动车发票等。若是,结果会以"form_result"这一关键字返回。

商用

智能文档解析

3

新增拉美-墨西哥城二Region,支持哥伦比亚身份证购买

新增拉美-墨西哥城二Region,支持哥伦比亚身份证购买。

商用

终端节点

4

身份证识别新增入参return_portrait_image、return_adjusted_image和响应参数portrait_image、adjusted_image

身份证识别新增入参return_portrait_image、return_adjusted_image和响应参数portrait_image、adjusted_image,支持返回头像图片信息(base64码)和返回身份证卡面(base64码)。

商用

身份证识别

5

通用文字识别新增支持语言:柬埔寨语识别

通用文字识别新增支持语言:柬埔寨语识别。

商用

通用文字识别

2024年02月

序号

功能名称

功能描述

阶段

相关文档

1

火车票识别新增3种支持类型

火车票识别在原有的纸质火车票识别基础上新增3种支持类型:电子发票、旧版退票凭证、新版退票凭证。

商用

火车票识别

2024年01月

序号

功能名称

功能描述

阶段

相关文档

1

智能分类识别新增4种支持票证类型

智能分类识别新增4种支持票证类型:车船票、网约车行程单、通用机打发票和增值税发票销货清单。

商用

智能分类识别

2

身份证识别新增支持身份证PS、模糊、反光等告警功能,且支持居民身份证的正反面同时识别

新增支持身份证PS、模糊、反光、边框完整性、边框内异物遮挡、复印件和临时身份证告警功能,且支持居民身份证的正反面同时识别,不支持存在两张及以上同面身份证的图片识别。

商用

身份证识别

3

亚太-曼谷新增泰国车牌识别

识别泰国车牌图片中的车牌信息,返回识别结果和车牌的区域位置信息。

商用

泰国车牌识别

4

OCR华北-北京4新增印章识别

检测和识别合同文件或常用票据中的印章,并可擦除和提取图片中的印章,通过JSON格式返回印章检测、识别、擦除和提取的结果。

商用

印章识别

5

飞机行程单识别新增tax、tax_rate、buyer_name等响应参数

飞机行程单识别新增响应参数:tax、tax_rate、buyer_name、buyer_id、number、international_flag、issue_status。

商用

飞机行程单识别

2023年11月

序号

功能名称

功能描述

阶段

相关文档

1

身份证识别新增入参return_portrait_location和响应参数portrait_location

身份证识别新增入参return_portrait_location和响应参数portrait_location,支持返回身份证回头像位置信息。

商用

身份证识别

2

通用文字识别新增支持4门语言:土耳其语、挪威语、丹麦语、瑞典语识别

通用文字识别新增支持4门语言:土耳其语、挪威语、丹麦语、瑞典语识别。

商用

通用文字识别

2023年10月

序号

功能名称

功能描述

阶段

相关文档

1

网络图片识别新增入参detect_text_direction

网络图片新增入参detect_text_direction,支持检测每个字段的文字方向。

商用

网络图片识别

2

OCR圣地亚哥Region新增哥伦比亚身份证识别

新增哥伦比亚身份证。识别哥伦比亚身份证中的文字信息,并将识别的结构化结果返回给用户。

商用

哥伦比亚身份证识别

3

通用表格识别新增入参with_borders

通用表格新增入参with_borders,支持有线表格与无线表格识别。

商用

通用表格识别

2023年09月

序号

功能名称

功能描述

阶段

相关文档

1

OCR华北-北京4新增车辆合格证识别

支持车辆合格证识别,识别车辆合格证中的文字信息,并返回识别的结构化结果。

商用

车辆合格证识别

2

OCR华北-北京4和广州Region新增承兑汇票识别

支持承兑汇票识别。识别承兑汇票识别中的关键字段, 并以json格式返回结构化结果。

商用

承兑汇票识别

3

OCR华北-北京4和广州Region新增不动产证识别

新增不动产证识别。识别不动产证中的文字信息,并返回识别的结构化结果。

商用

不动产证识别

2023年08月

序号

功能名称

功能描述

阶段

相关文档

1

OCR华北-北京4Region新增智能文档解析

支持智能文档解析,对证件、票据、表单等任意版式文档进行键值对提取、文字识别、以及表格识别等任务,实现进阶高效的自动化结构化返回。

商用

智能文档解析

2023年07月

序号

功能名称

功能描述

阶段

相关文档

1

中国站帐号支持开通泰文身份证识别API

中国站帐号支持开通泰文身份证识别API,可在中国站的曼谷局点开通服务并调用。

商用

泰文身份证识别

2023年06月

序号

功能名称

功能描述

阶段

相关文档

1

车牌识别API支持识别大型新能源车型

车牌识别API支持识别大型新能源车型,对应的plate_color参数返回值为yellow_green。

商用

车牌识别

2023年05月

序号

功能名称

功能描述

阶段

相关文档

1

OCR支持用户自定义模板

支持用户自定义模板,对于版式固定的各种票据和卡证,通过可视化界面、API进行识别。

商用

自定义OCR

2

智能分类识别API支持全电发票

智能分类识别API支持全电发票。接口会返回图片上要识别全电发票的位置坐标、结构化识别的内容以及对应的类别。

商用

智能分类识别

2023年04月

序号

功能名称

功能描述

阶段

相关文档

1

财务报表识别API支持通过透视变换矩阵计算文字在原图的坐标

财务报表识别API支持通过设置return_rectification_matrix参数,返回透视变换矩阵。可用于计算文字在原图中的坐标。

商用

财务报表识别

2023年03月

序号

功能名称

功能描述

阶段

相关文档

1

OCR增值税发票识别,支持全电发票

OCR增值税发票识别API,支持识别全电普通发票、全电专用发票。

商用

增值税发票识别

2023年01月

序号

功能名称

功能描述

阶段

相关文档

1

通用表格识别API支持通过透视变换矩阵计算文字在原图的坐标

OCR通用表格识别API支持通过设置return_rectification_matrix参数,返回透视变换矩阵。可用于计算文字在原图中的坐标。

商用

通用表格识别

2

通用文字识别API支持马来语、乌克兰语、印地语…识别功能

OCR通用文字识别API支持中英文以及部分繁体字、马来语、乌克兰语、印地语、俄语、越南语、印尼语、泰语识别。

商用

通用文字识别

2022年11月

序号

功能名称

功能描述

阶段

相关文档

1

发票验真API支持查验全电发票的信息

OCR发票验真API支持对全电发票(全面数据化电子发票)的内容进行查验。发票验真对接国税局,保证内容查验的真实性和有效性。

商用

发票验真

2

OCR北京一、北京四、上海一区域API支持按企业项目分账

OCR北京一、北京四、上海一区域部署的API支持企业项目管理,可按不同企业项目分别进行财务统计。企业项目之间相互独立,资源分开结算。

商用

企业项目管理

2022年10月

序号

功能名称

功能描述

阶段

相关文档

1

OCR上海一region上线发票、证件类识别API

OCR上海一region上线增值税发票识别、通用文字识别、营业执照识别、车牌识别、道路运输从业资格证识别。

商用

终端节点

2

通用文字识别API支持单字符检测功能

通用文字识别API支持检测单个文本行的单字符信息。

商用

通用文字识别

2022年09月

序号

功能名称

功能描述

阶段

相关文档

1

健康码、核酸检测记录、行程卡三合一检测API上线

OCR防疫健康码识别API支持同时检测健康码、核酸检测记录、行程卡。只需调用1个API即可实现对姓名、健康码颜色、核酸检测结果、核酸采样时间等内容的识别。

商用

防疫健康码识别

2022年08月

序号

功能名称

功能描述

阶段

相关文档

1

OCR上海一Region新增保险单识别、机动车销售发票识别、道路运输证识别

OCR上海一区域新增保险单识别、机动车销售发票识别、道路运输证识别服务,请您根据业务需要选择对应区域的终端节点。

商用

OCR终端节点

2

OCR支持企业项目管理,支持不同企业项目分别进行财务统计

OCR支持通过企业项目管理(EPS)对不同用户组和用户的资源使用进行分账。企业可以根据组织架构规划不同的企业项目,并为每个企业项目设置拥有不同权限的用户组和用户,多个企业项目之间相互独立,资源分开结算。

商用

企业项目管理

3

网络图片识别支持字体类型检测、支持竖行文本识别、支持多朝向文本识别。

网络图片识别,支持市面上大部分常见字体类型的检测(含商用需授权字体)、支持竖行文本识别、支持多朝向文本识别。

商用

网络图片识别API文档

4

身份证识别新增翻拍告警功能

身份证识别风险检测能力提升,新增翻拍告警功能。当输入参数detect_reproduce为true时,将返回翻拍告警结果,其中返回结果“true”表示是翻拍,“false”表示未经过翻拍。

商用

身份证识别API文档

2022年07月

序号

功能名称

功能描述

阶段

相关文档

1

增值税发票识别服务升级,type字段新增"special_electronic"返回类型

服务升级前,"增值税电子普通发票"和"增值税电子专用发票"统一归为electronic类型;服务升级后,"增值税电子普通发票"仍返回electronic类型,"增值税电子专用发票"将会归类为新的special_electronic类型。

商用

增值税发票识别API文档

2022年05月

序号

功能名称

功能描述

阶段

相关文档

1

OCR上线核酸检测记录API

支持对全国各地不同版式的核酸检测记录中的4个关键字段进行结构化识别,包括姓名、核酸检测采样时间、检测检测结果更新时间、核酸检测结果(阳性、阴性、未知)。

商用

核酸检测记录API

2

OCR上线防疫健康码识别API

识别防疫健康码中的姓名、健康码更新时间、健康码颜色,并将识别的结构化结果返回给用户。

商用

防疫健康码识别API接口

2022年03月

序号

功能名称

功能描述

阶段

相关文档

1

OCR上线细粒度授权功能

OCR支持细粒度授权功能上线,新增支持对OCR服务取消开通,新增支持OCR服务细粒度授权,主账号可通过该特性对IAM子用户的调用权限进行控制。

商用

细粒度授权文档

2

出租车发票识别、行驶证识别、火车票识别、银行卡识别新增支持返回字段位置信息

出租车发票识别、行驶证识别、火车票识别、银行卡识别新增支持返回字段位置信息,新增输入参数:return_text_location,新增输出字段:text_location,方便用户进行版式的二次处理,以及提高人工校验效率。

商用

出租车发票识别API接口

行驶证识别API接口

火车票识别API接口

银行卡识别API接口

3

增值税发票识别,增加print_code,print_number及文本框坐标字段

增值税发票识别,新增输入参数: return_text_location,新增输出字段:print_code,print_number,text_location。

商用

增值税发票识别API接口文档

4

身份证识别,返回结果携带坐标参数

身份证识别,返回结果新增text_location参数,返回识别到的文字块的区域位置信息。方便用户进行版式的二次处理,以及提高人工校验效率。

商用

身份证识别API说明

5

增值税发票识别,新增支持识别PDF、OFD文档

增值税发票识别,新增支持识别PDF、OFD文件,现共支持JPEG、JPG、PNG、BMP、TIFF、PDF、OFD格式,多页PDF仅识别第一页。

商用

增值税发票识别API接口

2022年02月

序号

功能名称

功能描述

阶段

相关文档

1

新增电子驾驶证识别功能

驾驶证识别,现已支持电子驾驶证、纸质驾驶证的识别,您可根据使用场景选择对应的驾驶证类型。

商用

驾驶证识别API文档

2021年12月

序号

功能名称

功能描述

阶段

相关文档

1

上线道路运输从业资格证识别

识别道路运输从业资格证上的关键文字信息,并返回识别的结构化结果。

商用

道路运输从业资格证识别

2021年10月

序号

功能名称

功能描述

阶段

相关文档

1

上线财务报表识别

识别用户上传的财报表格图片中的文字内容,并将识别的结果返回给用户。

商用

财务报表识别

2

上线保险单识别

识别保险单图片上的文字信息,并将识别的结构化结果返回给用户。支持对多板式保险单的扫描图片及手机照片进行结构化信息提取。

商用

保险单识别

2021年09月

序号

功能名称

功能描述

阶段

相关文档

1

新增发票验真功能

支持9种增值税发票的信息核验。

商用

发票验真

2021年08月

序号

功能名称

功能描述

阶段

相关文档

1

身份证识别功能优化

支持校验身份证号等信息: 身份证号合法性 身份证号与出生日期一致性 身份证号与性别一致性 当前日期是否在有效期内

商用

身份证识别

2021年06月

序号

功能名称

功能描述

阶段

相关文档

1

道路运输证服务优化,支持电子版证件识别

道路运输证识别服务精度优化,新增支持电子版证件识别

商用

道路运输证识别

2021年01月

序号

功能名称

功能描述

阶段

相关文档

1

营业执照识别功能优化

营业执照性能优化30%,支持大图识别。

商用

营业执照识别

2020年12月

序号

功能名称

功能描述

阶段

相关文档

1

飞机行程单识别功能优化

飞机行程单识别服务精度优化,支持不同场景下图片的识别。

商用

飞机行程单识别

2

接口更新

线上服务请求URI由v1.0接口统一切换成v2接口,例如通用文字识别URI由/v1.0/ocr/general-text更新成/v2/{project_id}/ocr/general-text。 原有的v1.0接口任然可以正常使用。

商用

API参考

2020年10月

序号

功能名称

功能描述

阶段

相关文档

1

增加服务部署区域

身份证、驾驶证、行驶证、银行卡、通用表格识别服务上线上海一区域。

商用

终端节点

2020年09月

序号

功能名称

功能描述

阶段

相关文档

1

文字识别控制台优化

在服务监控可视化界面增加各时间段查询功能。 新增套餐包管理界面查询方式(按时间查询、模糊查询等)。

商用

OCR服务控制台

2020年08月

序号

功能名称

功能描述

阶段

相关文档

1

文字识别控制台更新

文字识别服务管理控制台更新: 增加左侧菜单栏:总览、套餐包管理、服务监控、调用指南等功能。 优化服务授权、服务开通、套餐包购买、产品展示等功能和使用。 新增常用链接、快速入门、常见问题、问题分类等专栏链接。 服务监控推出可视化界面。 新增API调用、SDK调用等使用说明。

商用

OCR服务控制台

2

银行卡识别功能优化

银行卡识别服务优化竖版银行卡识别精度。

商用

银行卡识别

2020年07月

序号

功能名称

功能描述

阶段

相关文档

1

行驶证、驾驶证功能优化

行驶证、驾驶证识别服务增加返回发证机关功能。

商用

行驶证识别

驾驶证识别

2020年06月

序号

功能名称

功能描述

阶段

相关文档

1

新增VIN码识别、名片识别

VIN码识别:可以识别图片中的车架号信息,并将识别结果返回给用户。 名片识别:可以识别图片中的文字信息,并返回识别的结构化结果,支持对多种不同板式名片进行结构化信息提取。

商用

VIN码识别

名片识别

2020年04月

序号

功能名称

功能描述

阶段

相关文档

1

上线名片识别、VIN码识别

识别图片上的名片内容、车架号信息。名片识别支持对多种不同板式名片进行结构化信息提取。

商用

名片识别

VIN码识别

2

护照识别功能优化

护照识别服务性能提升8%。

商用

护照识别

2020年03月

序号

功能名称

功能描述

阶段

相关文档

1

移动端界面适配

华为云移动端控制台界面适配,支持移动端便捷购买套餐包。

商用

计费说明

2

价格更新

OCR线上服务降价50%。

商用

计费说明

3

行驶证识别功能优化

行驶证识别服务支持新能源车牌号码识别。

商用

行驶证识别

4

网络图片识别功能优化

网络图片识别服务性能提升1倍。

商用

网络图片识别

5

通用表格识别功能优化

通用表格识别服务精度优化,新增入参 return_text_location,支持文本和单元格的坐标返回。

商用

通用表格识别

2020年02月

序号

功能名称

功能描述

阶段

相关文档

1

车牌识别功能优化

车牌识别服务支持不同场景下图片的识别,精度提升。

商用

车牌识别

2019年10月

序号

功能名称

功能描述

阶段

相关文档

1

新增《快速入门》文档

使用SDK调用OCR服务 使用Postman调用OCR服务

商用

文字识别快速入门

2019年09月

序号

功能名称

功能描述

阶段

相关文档

1

文字识别控制台全新风格改版,更简洁易用

增加对象存储服务OBS授权功能。OCR服务功能菜单调整至左侧,统一风格,更多细节优化,全新界面,全新体验。

商用

OCR服务控制台

2

新增智能分类识别

智能分类识别:可以一次性对同张图片中的多个卡证、票据进行检测和识别,并返回每个卡证、票据的类别和结构化数据。

商用

智能分类识别

2019年07月

序号

功能名称

功能描述

阶段

相关文档

1

新增火车票识别、银行卡识别、营业执照识别

火车票识别:识别火车票中的文字信息,并返回识别的结构化结果。 银行卡识别:识别银行卡上的关键文字信息,并返回识别的结构化结果。 营业执照识别:识别营业执照图片中的文字信息,并返回识别的结构化结果。

商用

火车票识别

银行卡识别

营业执照识别

2

新增车辆通行费发票识别、飞机行程单识别、定额发票识别

车辆通行费发票识别:识别车辆通行费中的关键文字信息,并返回识别的结构化结果。 飞机行程单识别:识别飞机行程单中的文字信息,并返回识别的结构化结果。 定额发票识别:识别定额发票中的文字信息,并返回识别的结构化结果。

商用

车辆通行费发票识别

飞机行程单识别

定额发票识别

3

新增网络图片识别、出租车发票识别

网络图片识别:识别网络图片中的文字内容,并返回识别的结构化结果。 出租车发票识别:识别出租车发票中的文字信息,并返回识别的结构化结果。

商用

网络图片识别

出租车发票识别

4

新增护照识别、道路运输证识别

护照识别:识别护照图片中的文字信息,并返回识别的结构化结果。 道路运输证识别:识别道路运输证中的文字信息,并返回识别的结构化结果。

商用

护照识别

道路运输证识别

2018年09月

序号

功能名称

功能描述

阶段

相关文档

1

新增《使用前必读》文档

介绍调用API的流程和注意事项。

商用

API使用前必读

2017年11月

序号

功能名称

功能描述

阶段

相关文档

1

文字识别服务上线

文字识别(Optical Character Recognition,简称OCR)是指对图像文件的打印字符进行检测识别,将图像中的文字转换成可编辑的文本格式,以JSON格式返回识别结果。

商用

文字识别

相关文档