更新时间:2025-09-12 GMT+08:00

开始语音合成请求

功能介绍

客户端与语音合成引擎建立Websocket连接后,可以发送开始语音合成请求进行语音合成。如果客户端基于该Websocket连接发送多次合成请求,需在每次请求重新建立websocket连接,一次连接只能处理一次合成请求。

请求消息

表1 参数说明

名称

参数类型

是否必选

说明

command

String

需设置为START,表示开始识别请求。

text

String

待合成的文本,支持长度不大于10000字符的文本。

config

Object

配置信息。请参考表2

表2 config数据结构

名称

参数类型

是否必选

说明

audio_format

String

语音格式头:pcm

默认:pcm

sample_rate

String

采样率:16000、8000赫兹。

默认:8000

property

String

可参考表3

精品发音人每50字计一次。

subtitle

String

是否生成时间戳信息,不使用则不填写。

取值范围:

“word_level”:文本级别时间戳。

“phoneme_level”:音素级别时间戳。

表3 精品发音人property取值范围

名称

property取值

类型

使用场景

支持采样率(Hz)

支持audio_format

Ahmed

arabic_dh_male

数字人

阿拉伯语

8k/16k

pcm

Aisha

arabic_dh_female

数字人

阿拉伯语

8k/16k

pcm

Ahmed

english_dh_male

数字人

英语

8k/16k

pcm

Aisha

english_dh_female

数字人

英语

8k/16k

pcm

示例

{ 
    "command": "START",
    "text": "Nice to meet you.",
    "config": 
    { 
        "audio_format": "pcm", 
        "sample_rate": "16000", 
        "property": "english_dh_female"
    }
}

状态码

状态码请参见状态码

错误码

错误码请参见错误码