连续语音识别_如何调用WebSocket API-华为云

如何调用WebSocket API

如何调用WebSocket API 前提条件在调用实时语音识别的Websocket接口之前，您需要完成Token认证，详细操作指导请参见认证鉴权。接口使用介绍实时语音识别接口使用Websocket协议承载，客户端与服务端交流流程如图1所示。分为三个主要步骤： WebSocket握手。

来自：帮助中心

查看更多 →
错误码

检查是否发送end请求，是否关闭客户端。 SIS.0305 语音识别异常。请重试，或联系技术支持工程师。 SIS.0306 语音识别异常。请重试，或联系技术支持工程师。 SIS.0307 语音识别异常。请重试，或联系技术支持工程师。 SIS.0309 实时语音识别音频时长超过最大值。请注意音频的时

来自：帮助中心

查看更多 →
方案概述

应用场景该解决方案基于华为云语音交互服务语音识别构建，可自动将用户上传到对象存储服务的wav语音文件转化为文字，并将结果存放到指定OBS桶。该方案可以将用户上传在OBS的语音文件识别成可编辑的文本，支持中文普通话的识别和合成，其中语音识别还支持带方言口音的普通话识别以及方言（四川

来自：帮助中心

查看更多 →
识别结果响应

识别结果响应服务端在收到客户端发送的连续音频数据后，当服务端识别出结果后会实时向客户端按句推送识别结果响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型说明 resp_type String 响应类型。参数值为RESULT，表示识别结果响应。

来自：帮助中心

查看更多 →
websocket接口

chinese_8k_common 支持采样率为8k的中文普通话语音识别。 chinese_16k_common 支持采样率为16k的中文普通话语音识别。 sichuan_16k_common 支持采样率为16k的中文普通话与四川话方言语音识别。区域仅支持cn-north-4。max_seco

来自：帮助中心

查看更多 →
概述

别、语音合成）服务所提供的API为自研API。表1 实时语音识别接口说明接口类型说明实时语音识别接口华为云提供的Websocket接口，主要用于实时语音识别。音频分片传输，服务器端可以返回中间临时转写结果，在最后返回最终转写结果。表2 一句话识别接口说明接口类型说明

来自：帮助中心

查看更多 →
是否支持aac格式的语音文件转文字

是否支持aac格式的语音文件转文字一句话识别和录音文件识别以及实时语音识别均可实现语音转文字，一句话识别支持aac格式，录音文件识别和实时语音识别不支持aac格式。父主题：产品咨询类

来自：帮助中心

查看更多 →
如何解决“The silence time is too long, and the audio will not be recognized”报错

will not be recognized”？可能原因实时语音识别的初始静默时间过长无法识别。解决方案方法一：将参数设置中静默时间的参数vad_head 的值设置大一些，详细请参见API参考的实时语音识别的请求参数。方法二：处理音频文件，将识别文件初始的静默音频剪切掉。

来自：帮助中心

查看更多 →
一句话识别

当前服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域，支持一句话识别、录音文件识别、实时语音识别和语音合成和热词等接口。华东-上海一，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。支持pcm16k16bit、pcm8k16bit、ulaw16k

来自：帮助中心

查看更多 →
语音识别是强制绑定使用OBS进行录音文件存储吗

语音识别是强制绑定使用OBS进行录音文件存储吗不是，只有录音文件识别需要使用OBS服务，语音交互服务对用户存储在OBS的数据，具有只读权限，没有修改和删除的权限。所以用户是否删除上传至OBS服务的数据，需要用户根据自己的obs桶的使用情况或者容量大小确认，并在OBS服务上执行。

来自：帮助中心

查看更多 →
终端节点

当前服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。华东-上海一，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。一句话识别，录音文件识别支持的终端节点：表1 一句话识别、录音文件识别

来自：帮助中心

查看更多 →
错误码定义

错误码定义 CC-Gateway返回结果码订阅语音识别结果接口通用返回结果码 CTI返回通用错误码 CTI返回VDN配置接口错误码 CTI返回系统配置接口错误码 UAP返回错误码父主题：订阅语音识别结果接口

来自：帮助中心

查看更多 →
语音合成

当前服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域，支持一句话识别、录音文件识别、实时语音识别和语音合成和热词等接口。华东-上海一，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。支持中文、英文、中英文，文本不长于500个字符。支持合成采样率8kHz、16kHz。

来自：帮助中心

查看更多 →
API使用类

recognized”报错 Token怎么获取如何申请公测如何修改发音人实时语音识别多人同时使用，如何区分各自识别结果使用HTML5 Websocket API发送websocket请求如何携带token 如何查看实时语音识别的中间结果

来自：帮助中心

查看更多 →
发送音频数据

馈的情况下500ms。实时语音识别代码示例请参考SDK文档。当前SIS服务对于8k音频的分片大小限制为[160, 32768]字节, 16k音频的分片大小限制为[320, 65536]字节, 分片大小超出上限或低于下限会报错。父主题：实时语音识别请求

来自：帮助中心

查看更多 →
结束识别请求响应

结束识别请求响应服务器端收到“结束识别”请求时或语音识别过程中发生错误，服务端会向客户端推送如下响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型说明 resp_type String 响应类型。参数值为END，表示结束识别响应。

来自：帮助中心

查看更多 →
语音交互服务的区域如何选择

域请参见地区与终端节点。华北-北京四，为推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。华东-上海一，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。父主题：区域与可用区

来自：帮助中心

查看更多 →
意图/槽位变量（TOC）

ChatBotIntentCode 语音识别匹配到的意图返回意图码，字符串类型。系统预置如下几个ChatBotIntentCode，可直接使用： systemQA：通常可以通过获取该参数的值来判断是否匹配到了正确的意图上。 ChatBotRespContent 语音识别匹配到的意图返回的答复信息，包括槽位和响应中配置的答复。

来自：帮助中心

查看更多 →
CPP SDK（Windows）

CPP SDK（Windows）使用实时语音识别使用实时语音合成

来自：帮助中心

查看更多 →
CPP SDK（Linux）

CPP SDK（Linux）使用实时语音识别使用实时语音合成

来自：帮助中心

查看更多 →
约束与限制

约束与限制实时语音识别一句话识别录音文件识别语音合成录音文件识别极速版

来自：帮助中心

查看更多 →