文档首页 > > API参考> 使用前必读> 概述

概述

分享
更新时间: 2019/11/21 GMT+08:00

欢迎使用语音交互服务(Speech Interaction Service ,简称SIS)。语音交互是一种人机交互方式,以开放API(Application Programming Interface,应用程序编程接口)的方式提供给用户,用户通过实时访问和调用API获取语音交互结果。

语音交互(一句话识别、录音文件识别、短语音识别、语音合成、实时语音转写)服务所提供的API为自研API,您可以完整的使用如表1表2表3表4表 定制语音合成接口说明所示功能。

表1 短语音识别接口说明

API

说明

短语音识别

短语音识别服务可以针对用户上传的1分钟以内、不超过4MB的完整音频,识别出对应文字内容。

表2 语音合成接口说明

API

说明

语音合成

语音合成,是一种将文本转换成逼真语音的服务。用户通过实时访问和调用API获取语音合成结果,将用户输入的文字合成为音频。通过音色选择、自定义音量、语速,为企业和个人提供个性化的发音服务。

表3 实时语音转写接口说明

接口类型

说明

实时语音转写接口

华为云提供的Websocket接口,主要用于实时语音转写。音频分片传输,服务器端可以返回中间临时转写结果,在最后返回最终转写结果。

表4 定制语音识别接口说明

接口类型

说明

一句话识别

一句话识别接口,用于短语音的同步识别。一次性上传整个音频,响应中即返回识别结果。

录音文件识别

录音文件识别接口,用于转写不超过5小时的音频。由于录音文件转写需要较长的时间,因此转写是异步的。

表5 定制语音合成接口说明

接口类型

说明

定制语音合成

定制语音合成,是一种将文本转换成逼真语音的服务。用户通过实时访问和调用API获取语音合成结果,将用户输入的文字合成为音频。通过音色选择、自定义音量、语速,为企业和个人提供个性化的发音服务。

分享:

    相关文档

    相关产品

文档是否有解决您的问题?

提交成功!

非常感谢您的反馈,我们会继续努力做到更好!

反馈提交失败,请稍后再试!

*必选

请至少选择或填写一项反馈信息

字符长度不能超过200

提交反馈 取消

如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨

跳转到云社区