更新时间:2026-02-03 GMT+08:00
分享

开始指令

功能介绍

客户端与语音合成引擎建立WebSocket连接后,首先需要发送配置信息,其后合成的文本都是按照此配置执行,如果不发送开始指令或者多次发送开始指令,都会触发错误响应。流式语音合成支持“ONLY”和“MULTI”两种模式。“ONLY”模式下,用户发送一次文本,服务端流式返回语音数据;“MULTI”模式下,支持用户多次发送文本,服务端流式返回语音数据,可用于大模型输出实时播报等场景。

请求消息

表1 参数说明

名称

参数类型

是否必选

说明

command

String

需设置为START,表示开始识别请求。

config

Object

配置信息。请参考表2 config数据结构

text_pieces

String

文本条数:ONLY(仅一次)、MULTI(可发送多次文本)。默认:MULTI。

text

String

待合成的文本,支持长度不大于300字符的文本。text_pieces取值为ONLY时,文本同配置一同发送,此值必填;text_pieces取值为MULTI时,文本后续发送,不需要该参数。

表2 config数据结构

名称

参数类型

是否必选

说明

audio_format

String

语音格式头:pcm、mp3。

默认:pcm

sample_rate

String

采样率:24kHz、16kHz、8kHz。

默认:16kHz

voice_name

String

合成所使用的音色名称,可选择用户注册的音色或预置音色。预置音色取值范围参考表3

speed

Integer

语速。

取值范围:-500~500

默认值:0

pitch

Integer

音高。

取值范围: -500~500

默认值:0

volume

Integer

音量。

取值范围:0~100

默认值:50

表3 预置音色取值范围

名称

voice_name

类型

使用场景

支持采样率(Hz)

华小莉

chinese_huaxiaoli_common

标准女声

中英混合

8k/16k/24k

华小智

chinese_huaxiaozhi_common

男童声

中英混合

8k/16k/24k

华小天

chinese_huaxiaotian_common

朝气男声

中英混合

8k/16k/24k

华小媛

chinese_huaxiaoyuan_common

成熟女声

中英混合

8k/16k/24k

华小静

chinese_huaxiaojing_common

女童声

中英混合

8k/16k/24k

华小博

chinese_huaxiaobo_common

标准男声

中英混合

8k/16k/24k

华小柔

chinese_huaxiaorou_common

标准女声

中英混合

8k/16k/24k

华小悠

chinese_huaxiaoyou_common

嘹亮女声

中英混合

8k/16k/24k

华小晴

chinese_huaxiaoqing_common

青春女声

中英混合

8k/16k/24k

华小溪

chinese_huaxiaoxi_common

温柔女声

中英混合

8k/16k/24k

华小彤

chinese_huaxiaotong_common

俏皮女声

中英混合

8k/16k/24k

华小雅

chinese_huaxiaoya_common

标准女声

中英混合

8k/16k/24k

华小伟

chinese_huaxiaowei_common

成熟男声

中英混合

8k/16k/24k

华小帅

chinese_huaxiaoshuai_common

标准男声

中英混合

8k/16k/24k

华小杰

chinese_huaxiaojie_common

温柔男声

中英混合

8k/16k/24k

示例

ONLY模式
{ 
    "command": "START",
    "text": "欢迎使用语音云服务。",
    "text_pieces": "ONLY",
    "config": 
    { 
        "audio_format": "pcm", 
        "sample_rate": "16000", 
        "voice_name": "chinese_huaxiaoli_common",
        "speed": 0,
        "pitch": 0,
        "volume": 50
    }
}

MULTI模式

{ 
    "command": "START",
    "text_pieces": "MULTI",
    "config": 
    { 
        "audio_format": "pcm", 
        "sample_rate": "16000", 
        "voice_name": "chinese_huaxiaoli_common",
        "speed": 0,
        "pitch": 0,
        "volume": 50
    }
}

相关文档