语音识别为文字_对话交互后接口（inaction=9）-华为云

对话交互后接口（inaction=9）

False(语音导航场景特有字段) 当IACmd为match时，用于区分输入文本来自座席还是用户（智能匹配、智能工单相同），值为staff或customer staff：座席 customer：用户当IACmd为confirm时，传入座席点选的字段名，如：对象二级当IACmd为rematch时，可不填

来自：帮助中心

查看更多 →
发送音频数据

发送音频数据在收到“开始识别”的响应之后，可以开始发送音频数据。为节省流量，音频以二进制数据帧形式（binary message）的方式发送。音频数据将分片发送，也即在获得一定量音频数据的同时就可以发送一个binary message，每个分片建议在50ms~1000ms之间

来自：帮助中心

查看更多 →
结束识别请求响应

服务器端收到“结束识别”请求时或语音识别过程中发生错误，服务端会向客户端推送如下响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型说明 resp_type String 响应类型。参数值为END，表示结束识别响应。 trace_id

来自：帮助中心

查看更多 →
修订记录

一句话识别录音文件识别实时语音识别 2020-04-21 新增：热词管理章节 2019-11-29 新增： Python SDK章节 2019-11-18 整改SDK手册 2019-09-25 新增：语音合成章节 2019-08-06 新增：语音识别章节修改： Runtime

来自：帮助中心

查看更多 →
提取图片中的文字暗水印（文件地址版本）

项目所在region的id，如：xx-xx-1。 src_file 是 String 待提取文字暗水印的图片地址，当前只支持OBS，格式为 obs://bucket/object ，其中bucket为和当前项目处于同一区域的OBS桶名称，object为对象全路径名。例如：obs://hwbucket/hwinfo/hw

来自：帮助中心

查看更多 →
事件响应

式放置在text message中。响应消息表1 响应参数参数名参数类型说明 resp_type String 响应类型。参数值为EVENT，表示开始识别响应。 trace_id String 服务内部的令牌，可用于在日志中追溯具体流程。 event String 具体

来自：帮助中心

查看更多 →
语音识别是强制绑定使用OBS进行录音文件存储吗

语音识别是强制绑定使用OBS进行录音文件存储吗不是，只有录音文件识别需要使用OBS服务，语音交互服务对用户存储在OBS的数据，具有只读权限，没有修改和删除的权限。所以用户是否删除上传至OBS服务的数据，需要用户根据自己的obs桶的使用情况或者容量大小确认，并在OBS服务上执行。

来自：帮助中心

查看更多 →
错误码定义

错误码定义 CC-Gateway返回结果码订阅语音识别结果接口通用返回结果码 CTI返回通用错误码 CTI返回VDN配置接口错误码 CTI返回系统配置接口错误码 UAP返回错误码父主题：订阅语音识别结果接口

来自：帮助中心

查看更多 →
如何解决“The silence time is too long, and the audio will not be recognized”报错

will not be recognized”？可能原因实时语音识别的初始静默时间过长无法识别。解决方案方法一：将参数设置中静默时间的参数vad_head 的值设置大一些，详细请参见API参考的实时语音识别的请求参数。方法二：处理音频文件，将识别文件初始的静默音频剪切掉。

来自：帮助中心

查看更多 →
快速部署

在配置确认页面中，单击“创建执行计划”。图5 配置确认在弹出的创建执行计划框中，自定义填写执行计划名称，单击“确定”。图6 创建执行计划等待执行计划状态为“创建成功，待部署”后，单击“部署”，并且在弹出的执行计划确认框中单击“执行”。图7 执行计划图8 执行计划确认等待解决方案自动部署。

来自：帮助中心

查看更多 →
什么是内容审核

Moderation），是基于图像、文本、音频、视频、音频流、视频流、文档的检测技术，可自动检测涉黄、涉暴、图文违规等内容，对用户上传的图片、文字、音视频进行内容审核，以满足上传要求，帮助客户降低业务违规风险。随着互联网的飞速发展和信息量猛增，大量色情、暴力等不良信息夹杂其中，如果

来自：帮助中心

查看更多 →
一句话识别

当前服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域，支持一句话识别、录音文件识别、实时语音识别和语音合成和热词等接口。华东-上海一，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。支持pcm16k16bit、pcm8k16bit、ulaw16k

来自：帮助中心

查看更多 →
上传语音通知的文字转语音模板文件（createVoiceTemplate）

${TXT_数字}：表示变量为定义相应长度的字符串，数字表示该字符串的最大长度，如${TXT_9}表示最大长度为9字节的字符串。 ${NUM_数字}：表示变量只能为数字（0～9）的组合，数字表示该变量的最大个数，如${NUM_6}表示最大6个数字的组合。 ${DATE}表示变量为日期，格式要求为“YY

来自：帮助中心

查看更多 →
对接OCR实现图片上文字识别功能

小在15到8000之间，图片格式为JPG、PNG、BMP或TIFF。 “目标”取值为“side”时：请在“源”中，配置身份证正面还是反面，“源”配置为“front”，表示为身份证正面，配置为“back”，表示为身份证背面。输出参数 “源”设置为“result”，“目标”用于调用

来自：帮助中心

查看更多 →
错误码

请注意音频的时长限制，流式一句话（short-stream）和单句模式（sentence-stream）最长识别音频长度为60秒，连续模式（continue-stream）最长识别音频长度为5小时。 SIS.0312 超过最大资源并发限制。如果应用程序发送请求频率过高，请降低请求频率，或联系技术支持工程师。

来自：帮助中心

查看更多 →
API概览

URI 实时语音识别接口（请求）开始识别支持三种模式的请求消息：流式一句话 WSS /v1/{project_id}/rasr/short-stream 实时语音识别连续模式 WSS /v1/{project_id}/rasr/continue-stream 实时语音识别单句模式

来自：帮助中心

查看更多 →
终端节点

当前服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。华东-上海一，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。一句话识别，录音文件识别支持的终端节点：表1 一句话识别、录音文件识别

来自：帮助中心

查看更多 →
语音合成

当前服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域，支持一句话识别、录音文件识别、实时语音识别和语音合成和热词等接口。华东-上海一，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。支持中文、英文、中英文，文本不长于500个字符。支持合成采样率8kHz、16kHz。

来自：帮助中心

查看更多 →
配置热词表（可选）

PI确定（如创建中文类型热词表，请求英文语音识别接口，热词不会生效）。所有含英文的热词均需大写，如：Eiffel铁塔（正确示例为：EIFFEL铁塔）。所有数字均用相应的汉字表示，避免使用阿拉伯数字，如：12345服务热线（正确示例为：一二三四五服务热线）。热词内容仅包含英

来自：帮助中心

查看更多 →
OCR服务能否实时处理视频流中的文字

OCR服务能否实时处理视频流中的文字 OCR不支持读取视频流数据，您可将视频流进行提取帧图片操作，提取出图片后进行识别。父主题：产品咨询类

来自：帮助中心

查看更多 →
OCR文字识别服务计费可以按照项目来分别计费吗

OCR文字识别服务计费可以按照项目来分别计费吗可以。 OCR支持通过企业项目管理（EPS）对不同用户组和用户的资源使用进行分账。详情请参考API接口文档里的Enterprise-Project-Id参数。父主题：计费FAQ

来自：帮助中心

查看更多 →