什么是语音交互服务

语音交互服务（Speech Interaction Service，简称SIS）是一种人机交互方式，用户通过实时访问和调用API获取语音交互结果。例如用户通过语音识别功能，将口述音频或者语音文件识别成可编辑的文本，同时也支持通过语音合成功能将文本转换成逼真的语音等提升用户体验。适用场景如语音客服质检、会议记录、语音短消息、有声读物、电话回访等。

使用前必读

用户需要具备编程能力，熟悉Java、Python、IOS等编程语言。

用户通过调用API接口，将语音文件识别成可编辑的文本，然后返回JSON格式的识别结果，用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。

首次使用SIS

如果您是首次使用SIS的用户，建议您学习并了解如下信息：

功能介绍
 通过功能介绍章节的内容，了解SIS不同功能的具体介绍，主要包括实时语音识别（Real-time ASR）、一句话识别（Short Sentence Recognition）、语音合成（Text To Speech ）功能。
入门使用
 SIS以开放API的方式提供给用户，您可以参考《快速入门》学习并使用SIS服务。
使用方式
 如果您是一个开发工程师，熟悉代码编写，想要直接调用SIS的API使用服务，您可以参考《API参考》或《SDK参考》获取详情。
由浅入深学习
 您可以参考成长地图，由浅入深学习使用SIS。

下一篇：功能介绍

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消