音频识别_主体识别-华为云

主体识别

主体识别功能介绍用户传入图片通过后台算法判断图片主体，并返回主体坐标，具体识别的主体请参考应用场景。前提条件使用主体识别服务之前需要您完成服务申请和认证鉴权。图像识别服务属于公有云服务，线上用户资源共享，如果需要多并发请求，请提前联系我们。调试您可以在API Exp

来自：帮助中心

查看更多 →
名片识别

名片识别功能介绍识别名片图片上的文字信息，并以JSON格式返回识别的结构化结果。支持对多种不同版式名片进行结构化信息提取。该接口的使用限制请参见约束与限制，详细使用指导请参见OCR服务使用简介章节。图1 名片示例图约束与限制只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。

来自：帮助中心

查看更多 →
印章识别

印章识别功能介绍检测和识别合同文件或常用票据中的印章，并可擦除和提取图片中的印章，通过JSON格式返回印章检测、识别、擦除和提取的结果。该接口的使用限制请参见约束与限制，详细使用指导请参见OCR服务使用简介章节。约束与限制支持JPEG、JPG、PNG、BMP、TIFF、P

来自：帮助中心

查看更多 →
回铃音识别

回铃音识别座席执行外呼任务时可能会产生大量外呼失败数据，但因座席人员外呼任务繁重无法登记分析失败原因；租户管理员可通过回铃音识别意图进行意图识别，自动识别外呼失败结果后，将结果保存回铃音报表中，为租户管理员提供分析依据。操作步骤以租户管理员角色登录AICC，选择“ 外呼任务

来自：帮助中心

查看更多 →
结束识别

是 String 表示客户端结束识别请求，参数值设置为END。 cancel 否 Boolen 是否取消返回识别结果。 true：表示取消识别，也即丢弃识别中和未识别的语音数据并结束，不返回剩余的识别结果。 false：表示继续处理识别中和未识别的语音数据直到处理完所有之前发送的数据。

来自：帮助中心

查看更多 →
名人识别

名人识别功能介绍分析并识别图片中包含的敏感人物、明星及网红人物，返回人物信息及人脸坐标。前提条件使用名人识别服务之前需要您完成服务申请和认证鉴权。图像识别服务属于公有云服务，线上用户资源共享，如果需要多并发请求，请提前联系我们。调试您可以在 API Explorer 中调试该接口，支持自动认证鉴权。API

来自：帮助中心

查看更多 →
标签识别

标签识别功能介绍对用户传入的图像可以返回图像中的物体名称、所属类别及置信度信息。前提条件使用标签识别服务之前需要您完成服务申请和认证鉴权。图像识别服务属于公有云服务，线上用户资源共享，如果需要多并发请求，请提前联系我们。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API

来自：帮助中心

查看更多 →
识别结果

识别结果敏感数据识别任务扫描完成后，可在结果明细界面查看识别结果详情，同时支持将生成的识别结果下载到本地查看，本章节介绍如何查看查看别结果以及下载识别结果。前提条件至少执行过一次敏感数据识别任务，新建敏感数据识别任务请参见新建敏感数据识别任务。查看识别结果登录管理控制台。

来自：帮助中心

查看更多 →
读取音频数据

参数名说明 data 输出参数，存放读取到音频数据的智能指针。 size 输出参数，读取到音频数据的大小。 n 输入参数，一次读取音频帧数，最大不超过512。返回值成功返回0，失败则返回-1，失败时可通过日志查看原因。父主题：音频输入模块

来自：帮助中心

查看更多 →
读取音频数据

读取音频数据该接口用于读取n帧音频数据。仅支持1.0.8及以上固件版本。接口调用 hilens.AudioCapture.read(nFrames) 参数说明表1 参数说明参数名是否必选参数类型描述 nFrames 否整型要读取的帧数量，默认值为1。支持最多一次读取

来自：帮助中心

查看更多 →
蓝藻识别

"event_set":[] } } JSON格式说明字段类型说明 event_type Uint64 快速标识蓝藻识别算法的输出消息类型。蓝藻识别事件其值固定为34078721，对应16进制为 0x 0000 0000 0208 0001. task_id String

来自：帮助中心

查看更多 →
车牌识别

车牌识别功能介绍识别输入图片中的车牌信息，并以JSON格式返回其坐标和内容。该接口的使用限制请参见约束与限制，详细使用指导请参见OCR服务使用简介章节。图1 车牌示例图支持车牌信息、车牌颜色识别，支持双行车牌识别，支持单张图片内多个车牌识别。目前支持车牌类型含小型汽车

来自：帮助中心

查看更多 →
护照识别

护照识别功能介绍识别护照首页图片中的文字信息，并以JSON格式返回识别的结构化结果。当前版本支持2012年及以后发行的中国普通电子护照的全字段识别。中国-港澳台地区、外国护照支持护照下方两行国际标准化的机读码识别，并可从中提取7个关键字段信息。该接口的使用限制请参见约束与限

来自：帮助中心

查看更多 →
播放音频文件（混音）

播放音频文件（混音）功能描述混音是将音频文件和麦克风音频混合，一般用于播放时长较长的背景音乐或者伴奏。同一时间只能播放一个音频文件，播放给房间内的其他用户听。支持播放本地或在线音乐文件，文件格式支持播放wav、pcm和单声道mp3音频格式。接口调用流程实现过程加入房间并发布本端主流

来自：帮助中心

查看更多 →
发送音频数据

发送音频数据在收到“开始识别”的响应之后，可以开始发送音频数据。为节省流量，音频以二进制数据帧形式（binary message）的方式发送。音频数据将分片发送，也即在获得一定量音频数据的同时就可以发送一个binary message，每个分片建议在50ms~1000ms之间

来自：帮助中心

查看更多 →
音频采集器

音频采集器本地音频文件构造音频采集器，如果创建失败可以查看技能日志或输出来定位错误原因，本地麦克风使用默认参数采集数据，采样率44100，位宽16bit，双声道采集，每一帧采样点数1024。接口调用 1.0.8及以上固件版本 static std::shared_ptr<AudioCapture>

来自：帮助中心

查看更多 →
设置本地音频输出

设置本地音频输出接口名称 WEB_SetAIOutputAPI 功能描述设置本地音频输出时调用该接口。应用场景设置本地音频输出是否启用。 URL https://ip/action.cgi?ActionID=WEB_SetAIOutputAPI 参数表1 设置本地音频输出参数

来自：帮助中心

查看更多 →
音频采集器

音频采集器该接口用于构造一个音频采集器，从本地麦克风获取音频或者本地音频文件获取音频数据。接口调用 1.0.8及以上固件版本 hilens.AudioCapture(file_path) 1.1.2及以上固件版本 hilens.AudioCapture(sample_rate

来自：帮助中心

查看更多 →
创建音频转码任务

创建音频转码任务您可以创建音频转码任务，按需求选择音频转码模板，对存储在对象存储桶中的音频文件进行转码。音频转码的费用与视频转码是不同的，具体请参见价格详情。前提条件原始音频文件已上传到对象存储桶中，且使用的媒体处理服务与对象存储桶在同一区域，若还未上传，请参见上传文件处理。

来自：帮助中心

查看更多 →
开启/关闭音频投放

开启/关闭音频投放接口描述该接口用于开启/关闭音频投放功能。注意事项仅支持安卓10以上设备和target sdk 29及以上的应用。音频采集需要用户授权方法定义 /** * 开启或关闭音频投放 * @param activity 任意页面的activity对象

来自：帮助中心

查看更多 →
纯音频场景下不同码率的音频计费有区别吗？

纯音频场景下不同码率的音频计费有区别吗？纯音频场景，不区分音频码率。父主题：计费购买

来自：帮助中心

查看更多 →