ocr音频识别文字_视频背景音乐识别-华为云

视频背景音乐识别

视频背景音乐识别功能介绍背景音乐识别接口用于识别视频的背景音乐，返回背景音乐名称。 URI URI格式 POST /v1.0/bgm/recognition 请求消息请求参数说明请参见表1。表1 请求参数说明名称是否必选类型说明 url 是 String 视频的U

来自：帮助中心

查看更多 →
准备数据

受技术与成本多种因素制约，文字识别服务存在一些约束限制。以通用文字识别API为例，输入数据存在以下约束。其他API的的使用约束请参见约束与限制。只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。图像各边的像素大小在15px到8192px之间。图像中识别区域有效占比超过

来自：帮助中心

查看更多 →
行驶证识别

行驶证识别功能介绍识别行驶证图片中主页和副页的文字内容，并将识别的结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制，详细使用指导请参见OCR服务使用简介章节。图1 行驶证示例图如果图片中包含多张卡证票据，请调用智能分类识别服务。约束与限制只支持中国大陆行驶证的识别。

来自：帮助中心

查看更多 →
OCR服务是否支持二维码识别

OCR服务是否支持二维码识别不支持二维码识别。父主题：产品咨询类

来自：帮助中心

查看更多 →
上传模板图片

在使用单模板工作流开发应用之前，必须确保需要识别的图片都属于同一类型的模板。同一类模板的图片，它们有相同的版面排布，且要识别的文字类型和位置均要求固定。如果您的图片具有多种模板，请考虑使用“多模板工作流”。确认模板类型后，要准备一张文字清晰的图作为模板图片，模板图中要包含业务需要定制识别的字段。例如上传某

来自：帮助中心

查看更多 →
API概览

ON格式返回识别的结构化结果。手写文字识别识别手写文字图片中的文字内容。证件类身份证识别识别身份证图片中正面与反面的文字内容，并返回识别的文字和坐标。户口本识别识别户口本中的文字信息，并返回识别的结构化结果。行驶证识别识别行驶证图片中主页与副页的文字内容，并返回识别的文字和坐标。

来自：帮助中心

查看更多 →
修订记录

申请服务操作步骤参见文档为《文字识别 API参考》。 2018-07-30 修改删除银行卡识别、一维码识别、二维码识别和车牌识别相关内容。 2018-05-10 新增银行卡识别服务的demo用例一维码识别服务的demo用例二维码识别服务的demo用例车牌识别服务的demo用例机动车销售发票识别的demo用例

来自：帮助中心

查看更多 →
方案概述

创建用于存储发票识别与验真结果的对象存储服务 OBS桶，企业业务系统定时从该桶中获取结果并处理。函数工作流 FunctionGraph：用于实现调用文字识别服务的业务逻辑，当OBS桶收到上传的发票文件后，会自动通知函数调用文字识别服务，并将结果存放到指定的OBS桶里。文字识别 OCR

来自：帮助中心

查看更多 →
与其他云服务的关系

Management，简称IAM）服务，IAM为文字识别提供了用户认证和鉴权功能。云监控云监控（Cloud Eye）可以监控文字识别的相关指标，具体如表1所示。用户可以通过指标及时了解文字识别的使用情况。Cloud Eye的更多信息请参见《云监控用户指南》。表1 OCR的监控指标指标名称指标含义

来自：帮助中心

查看更多 →
自定义模板OCR

自定义模板OCR OCR自定义模板将于2025.12.31正式下线，为避免影响您目前的业务，请您及时进行相关迁移工作，迁移指导详见OCR自定义模板下线公告。功能介绍自定义模板OCR，支持用户自定义模板，对于版式固定的各种票据和卡证，通过可视化界面操作，指定需要识别的关键字段，

来自：帮助中心

查看更多 →
音频提取

音频提取功能介绍本接口为异步接口，创建音频提取任务下发成功后会返回asset_id和提取的audio_asset_id，但此时音频提取任务并没有立即完成，可通过消息订阅界面配置的音频提取完成事件来获取音频提取任务完成与否。调试您可以在 API Explorer 中调试该接口，支持自动认证鉴权。API

来自：帮助中心

查看更多 →
护照识别

护照识别功能介绍识别护照首页图片中的文字信息，并以JSON格式返回识别的结构化结果。当前版本支持2012年及以后发行的中国普通电子护照的全字段识别。中国-港澳台地区、外国护照支持护照下方两行国际标准化的机读码识别，并可从中提取7个关键字段信息。该接口的使用限制请参见约束与限

来自：帮助中心

查看更多 →
计费FAQ

已关闭OCR服务，为什么会出现额外的计费或欠费套餐包购买后是否支持退款套餐用完如何计费，如何查看剩余量及预警企业主账号购买的套餐包资源，子账号如何使用多个套餐包扣减顺序什么是宽限期和保留期 OCR识别中，哪些算有效计费不同API的套餐包是否可以共享 OCR文字识别服务计费可以按照项目来分别计费吗

来自：帮助中心

查看更多 →
营业执照识别

营业执照识别功能介绍识别营业执照首页图片中的文字信息，并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制，详细使用指导请参见OCR服务使用简介章节。图1 营业执照示例图图2 营业执照示例图-横版约束与限制只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片及PDF。

来自：帮助中心

查看更多 →
使用流程简介

OCR服务需要用户通过调用API接口，将图片或扫描件中的文字识别成可编辑的文本，然后返回JSON格式的识别结果，用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。关于文字识别的相关声明请参见文字识别服务声明。文字识别服务等级协议请参见华为云服务等级协议。

来自：帮助中心

查看更多 →
附录

基本概念、云服务简介、专有名词解释：文字识别服务 OCR：文字识别（Optical Character Recognition，简称OCR）是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式，以JSON格式返回识别结果。对象存储服务 OBS：对象存储服务（Object

来自：帮助中心

查看更多 →
VIN码识别

VIN码识别功能介绍识别图片中的车架号信息，并将识别结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制，详细使用指导请参见OCR服务使用简介章节。图1 VIN码示例图约束与限制只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。图像各边的像素大小在15px到4096px之间。

来自：帮助中心

查看更多 →
车辆合格证识别

车辆合格证识别功能介绍识别车辆合格证中的文字信息，并返回识别的结构化结果。约束与限制只支持中国大陆车辆合格证的识别。只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。图像各边的像素大小在15到8192px之间。图像中识别区域有效占比超过80%，保证整张车辆合格证内容及其边缘包含在图像内。

来自：帮助中心

查看更多 →
应用场景

应用场景语音客服质检识别客服、客户的语音，转换为文本。进一步通过文本检索，检查有没有违规、敏感词、电话号码等信息。会议记录对会议记录的音频文件，进行快速的识别，转化成文字，方便进行会议记录。语音短消息通过语音发送或者接收短消息时，将音频短消息转文字，提升阅读效率和交互体验。

来自：帮助中心

查看更多 →
定额发票识别

定额发票识别功能介绍识别定额发票中的文字信息，并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制，详细使用指导请参见OCR服务使用简介章节。图1 定额发票示例图如果图片中包含多张卡证票据，请调用智能分类识别服务。约束与限制支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。

来自：帮助中心

查看更多 →
方案概述

证、道路运输从业资格证五种证件的识别和人证核身服务。方案架构该解决方案基于华为云文字识别 OCR服务的证件识别和人证核身服务 IVS技术构建，可帮助客户快速使用AI技术进行证件审查和人证核身，并且通过对象存储服务 OBS进行图片的上传以及识别结果的存放。该解决方案部署架构如下图所示：

来自：帮助中心

查看更多 →