更新时间:2022-04-26 GMT+08:00
分享

开始语音合成请求

功能介绍

客户端与语音合成引擎建立Websocket连接后,可以发送开始语音合成请求进行语音合成。如果客户端基于该Websocket连接发送多次合成请求,需在每次请求重新建立websocket连接,一次连接只能处理一次合成请求。

请求消息

表1 参数说明

名称

参数类型

是否必选

说明

command

String

需设置为START,表示开始识别请求。

text

String

待合成的文本,文本长度限制小于500字符。

config

Object

配置信息。请参考表2

表2 config数据结构

名称

参数类型

是否必选

说明

audio_format

String

语音格式头:pcm、alaw、ulaw。

默认:pcm

sample_rate

String

采样率:16000、8000。

默认:8000

property

String

语音合成特征字符串,组成形式为{language}_{speaker}_{domain},即“语种_人员标识_领域”。

  • language取值范围:
    • chinese
  • speaker取值范围:
    • xiaoqi 正式女生
    • xiaoyu正式男生
    • xiaoyan情感女生
    • xiaowang童声
  • domain取值范围:
    • common,通用领域

默认:chinese_xiaoyan_common

实时语音合成和语音合成属于同一种资源,按次计费。实时语音合成只支持普通发音人,每100字计一次。

speed

Integer

语速。

取值范围:-500~500

默认值:0

pitch

Integer

音高。

取值范围:-500~500

默认值:0

volume

Integer

音量。

取值范围:0~100

默认值:50

示例

{ 
    "command": "START",
    "text": "欢迎使用语音云服务。",
    "config": 
    { 
        "audio_format": "pcm", 
        "sample_rate": "8000", 
        "property": "chinese_xiaoyan_common",
        "speed": 10,
        "pitch": 10,
        "volume": 60
    }
}

状态码

状态码请参见状态码

错误码

错误码请参见错误码

分享:

    相关文档

    相关产品

关闭导读