开始指令
功能介绍
客户端与语音合成引擎建立WebSocket连接后,首先需要发送配置信息,其后合成的文本都是按照此配置执行,如果不发送开始指令或者多次发送开始指令,都会触发错误响应。流式语音合成支持“ONLY”和“MULTI”两种模式。“ONLY”模式下,用户发送一次文本,服务端流式返回语音数据;“MULTI”模式下,支持用户多次发送文本,服务端流式返回语音数据,可用于大模型输出实时播报等场景。
请求消息
|
名称 |
参数类型 |
是否必选 |
说明 |
|---|---|---|---|
|
command |
String |
是 |
需设置为START,表示开始识别请求。 |
|
config |
Object |
否 |
配置信息。请参考表2 config数据结构。 |
|
text_pieces |
String |
否 |
文本条数:ONLY(仅一次)、MULTI(可发送多次文本)。默认:MULTI。 |
|
text |
String |
否 |
待合成的文本,支持长度不大于300字符的文本。text_pieces取值为ONLY时,文本同配置一同发送,此值必填;text_pieces取值为MULTI时,文本后续发送,不需要该参数。 |
|
名称 |
参数类型 |
是否必选 |
说明 |
|---|---|---|---|
|
audio_format |
String |
否 |
语音格式头:pcm、mp3。 默认:pcm |
|
sample_rate |
String |
否 |
采样率:24kHz、16kHz、8kHz。 默认:16kHz |
|
voice_name |
String |
是 |
合成所使用的音色名称,可选择用户注册的音色或预置音色。预置音色取值范围参考表3。 |
|
speed |
否 |
Integer |
语速。 取值范围:-500~500 默认值:0 |
|
pitch |
否 |
Integer |
音高。 取值范围: -500~500 默认值:0 |
|
volume |
否 |
Integer |
音量。 取值范围:0~100 默认值:50 |
|
名称 |
voice_name |
类型 |
使用场景 |
支持采样率(Hz) |
|---|---|---|---|---|
|
华小莉 |
chinese_huaxiaoli_common |
标准女声 |
中英混合 |
8k/16k/24k |
|
华小智 |
chinese_huaxiaozhi_common |
男童声 |
中英混合 |
8k/16k/24k |
|
华小天 |
chinese_huaxiaotian_common |
朝气男声 |
中英混合 |
8k/16k/24k |
|
华小媛 |
chinese_huaxiaoyuan_common |
成熟女声 |
中英混合 |
8k/16k/24k |
|
华小静 |
chinese_huaxiaojing_common |
女童声 |
中英混合 |
8k/16k/24k |
|
华小博 |
chinese_huaxiaobo_common |
标准男声 |
中英混合 |
8k/16k/24k |
|
华小柔 |
chinese_huaxiaorou_common |
标准女声 |
中英混合 |
8k/16k/24k |
|
华小悠 |
chinese_huaxiaoyou_common |
嘹亮女声 |
中英混合 |
8k/16k/24k |
|
华小晴 |
chinese_huaxiaoqing_common |
青春女声 |
中英混合 |
8k/16k/24k |
|
华小溪 |
chinese_huaxiaoxi_common |
温柔女声 |
中英混合 |
8k/16k/24k |
|
华小彤 |
chinese_huaxiaotong_common |
俏皮女声 |
中英混合 |
8k/16k/24k |
|
华小雅 |
chinese_huaxiaoya_common |
标准女声 |
中英混合 |
8k/16k/24k |
|
华小伟 |
chinese_huaxiaowei_common |
成熟男声 |
中英混合 |
8k/16k/24k |
|
华小帅 |
chinese_huaxiaoshuai_common |
标准男声 |
中英混合 |
8k/16k/24k |
|
华小杰 |
chinese_huaxiaojie_common |
温柔男声 |
中英混合 |
8k/16k/24k |
示例
{
"command": "START",
"text": "欢迎使用语音云服务。",
"text_pieces": "ONLY",
"config":
{
"audio_format": "pcm",
"sample_rate": "16000",
"voice_name": "chinese_huaxiaoli_common",
"speed": 0,
"pitch": 0,
"volume": 50
}
}
MULTI模式
{
"command": "START",
"text_pieces": "MULTI",
"config":
{
"audio_format": "pcm",
"sample_rate": "16000",
"voice_name": "chinese_huaxiaoli_common",
"speed": 0,
"pitch": 0,
"volume": 50
}
}