最新动态

更新时间:2022/01/24 GMT+08:00
分享

本文介绍了语音交互服务 SIS各特性版本的功能发布和对应的文档动态,欢迎体验。

2021年11月

序号

功能名称

功能描述

阶段

相关文档

1

SIS上线IOS SDK

语音交互服务支持IOS SDK。

商用

SIS IOS SDK参考

2021年04月

序号

功能名称

功能描述

阶段

相关文档

1

录音文件识别支持银行、保险领域文件识别

录音文件识别支持银行领域(chinese_8k_bank)和保险领域(chinese_8k_insurance)的文件识别。 实时语音转写支持采样率为16k的庭审会议(chinese_16k_court)实时语音转写和采样率为16k的IT会议(chinese_16k_it)实时语音转写。

商用

录音文件识别

实时语音转写

2

一句话识别、录音文件识别和实时语音转写支持输出分词结果

将语音识别结果中输出分词结果信息。 当取值设置为 yes 时,返回的识别结果中除了一句话的文字,同时将这句话进行分词,并且给出每个分词起始和结束的时间,这样就可以进行进一步的操作,例如建立倒排索引,以便于进行多媒体信息检索等。

商用

一句话识别

录音文件识别

实时语音转写

2021年03月

序号

功能名称

功能描述

阶段

相关文档

1

一句话识别和实时语音转写支持方言识别(四川话、粤语、上海话)

新增方言(四川话、粤语、上海话)识别。具体如下: shanghai_16k_common:支持采样率为16k的上海话方言识别。 sichuan_16k_common:支持采样率为16k的中文普通话与四川话方言识别。 cantonese_16k_common:支持采样率为16k的粤语方言识别。

商用

一句话识别

实时语音转写

2020年08月

序号

功能名称

功能描述

阶段

相关文档

1

SIS上线语音合成精品发音库

精品发音库:语音合成 发音人分为普通发音人和精品发音人。 chinese_16k_general : 支持采样率为16k的中文普通话语音识别,同时可识别一些简单的方言 。

商用

定制语音合成

一句话识别

2

新增定制语音合成

定制语音合成:将文本转换成逼真语音,通过音色选择、自定义音量、语速,为企业和个人提供个性化的发音服务。

商用

定制语音合成

2020年07月

序号

功能名称

功能描述

阶段

相关文档

1

SIS支持识别语音中阿拉伯数字

上线digit_norm参数,表示是否将语音中的数字识别为阿拉伯数字,取值为yes 、 no,默认为yes。

商用

一句话识别

录音文件识别

开始识别

2019年08月

序号

功能名称

功能描述

阶段

相关文档

1

新增一句话识别、录音文件识别

一句话识别:用于短语音的同步识别。 录音文件识别:用于识别长录音文件。

商用

一句话识别

录音文件识别

2019年07月

序号

功能名称

功能描述

阶段

相关文档

1

语音交互服务上线

语音交互服务(Speech Interaction Service,简称SIS)是一种人机交互方式,以开放API(Application Programming Interface,应用程序编程接口)的方式提供给用户,用户通过实时访问和调用API获取语音交互结果。

商用

产品介绍

快速入门

API参考

分享:

    相关文档

    相关产品

关闭导读