文档首页 > > API参考> 语音合成接口

语音合成接口

分享
更新时间:2020/08/25 GMT+08:00

功能介绍

语音合成,是一种将文本转换成逼真语音的服务。用户通过实时访问和调用API获取语音合成结果,将用户输入的文字合成为音频。通过音色选择、自定义音量、语速,为企业和个人提供个性化的发音服务。该接口的使用限制请参见约束与限制,详细使用指导请参见SIS服务使用简介章节。

URI

URI格式

POST /v1.0/voice/tts

请求消息

请求参数请参见表 请求参数说明
表1 请求参数说明

参数名

是否必选

参数类型

说明

text

String

待合成文本,文本的长度不大于500字/词。

voice_name

String

合成的声音人员标识:
  • xiaoyan,女性声音,默认声音标识。
  • xiaoqi,女性声音。
  • xiaoyu,男性声音。

volume

Integer

音量:-20~20,默认为0。

sample_rate

String

采样率。

8k代表8kHz,16k代表16kHz,当前支持8kHz和16kHz。

speech_speed

Integer

语速:-500~500,默认为0。

pitch_rate

Integer

音高:-500~500,默认为0。

响应消息

响应参数请参见表 响应参数说明
表2 响应参数说明

参数名

是否必选

参数类型

说明

result

Object

调用成功时为合成语音内容,请参考表 result数据结构

调用失败时无此字段。

error_code

String

调用失败时的错误码。

调用成功时无此字段。

error_msg

String

调用失败时的错误信息。

调用成功时无此字段。

表3 result数据结构

参数名

是否必选

参数类型

说明

data

String

合成后生成的语音数据,以Base64编码格式返回。用户如需生成音频,需要将Base64编码解码成byte数组,再保存为wav音频。

说明:

语音数据输出的格式为wav格式。

示例

“endpoint”即调用API的请求地址,不同服务不同区域的“endpoint”不同,具体请参见终端节点

  • 请求示例
    POST https://{endpoint}/v1.0/voice/tts
       
    Request Header:  
    Content-Type:application/json
    X-Auth-Token: MIINRwYJKoZIhvcNAQcCoIINODCCDTQCAQExDTALBglghkgBZQMEAgEwgguVBgkqhkiG...   
    
    Request Body:
    {
      "text":"This is a test sample.",
      "voice_name":"xiaoyan",
      "volume":"0",
      "sample_rate":"16k",
      "speech_speed":"0",
      "pitch_rate":"0"
    }
  • 成功响应示例
    {
      "result":{ 
      "data":"/+MgxAAUeHpMAUkQAANhuRACAIAgKHKQmRisVo0aNAgQIIQyCgGBiwfB8H4IAgCAJg+D4Ph+IAQBBywfB8HwQDGAwfB8Hwf..."
      }
    }  
  • 失败响应示例
    {
        "error_code": "SIS.0005",
        "error_msg": "The service does not exist."
    }

状态码

状态码请参见状态码

错误码

错误码请参见错误码

分享:

    相关文档

    相关产品

文档是否有解决您的问题?

提交成功!非常感谢您的反馈,我们会继续努力做到更好!
反馈提交失败,请稍后再试!

*必选

请至少选择或填写一项反馈信息

字符长度不能超过200

提交反馈 取消

如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨

智能客服提问云社区提问