文档首页/ 语音交互服务 SIS/ 产品介绍/ 什么是语音交互服务
更新时间:2023-11-06 GMT+08:00

什么是语音交互服务

语音交互服务(Speech Interaction Service,简称SIS)是一种人机交互方式,用户通过实时访问和调用API获取语音交互结果。例如用户通过语音识别功能,将口述音频或者语音文件识别成可编辑的文本,同时也支持通过语音合成功能将文本转换成逼真的语音等提升用户体验。适用场景如语音客服质检、会议记录、语音短消息、有声读物、电话回访等。

使用前必读

用户需要具备编程能力,熟悉Java、Python、IOS等编程语言。

用户通过调用API接口,将语音文件识别成可编辑的文本,然后返回JSON格式的识别结果,用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。

首次使用SIS

如果您是首次使用SIS的用户,建议您学习并了解如下信息:

  • 功能介绍

    通过功能介绍章节的内容,了解SIS不同功能的具体介绍,主要包括实时语音识别(Real-time ASR)、一句话识别(Short Sentence Recognition)、语音合成(Text To Speech )功能。

  • 入门使用

    SIS以开放API的方式提供给用户,您可以参考《快速入门》学习并使用SIS服务。

  • 使用方式

    如果您是一个开发工程师,熟悉代码编写,想要直接调用SIS的API使用服务,您可以参考《API参考》或《SDK参考》获取详情。

  • 由浅入深学习

    您可以参考成长地图,由浅入深学习使用SIS。