最新动态
本文介绍了语音交互服务 SIS各特性版本的功能发布和对应的文档动态,欢迎体验。
2024年01月
序号 |
功能名称 |
功能描述 |
阶段 |
相关文档 |
---|---|---|---|---|
1 |
SIS北京四、上海一region支持热词3.0 |
通过普通热词、自定义权重热词、强制替换热词提供更灵活的热词配置 普通热词:用于常见的命名实体 自定义权重热词:调节热词偏置力度,提升热词召回率 强制替换热词:用于罕见词语、自定义格式输出 |
商用 |
2023年09月
序号 |
功能名称 |
功能描述 |
阶段 |
相关文档 |
---|---|---|---|---|
1 |
语音交互服务支持IOS SDK |
语音交互服务支持IOS SDK。 |
商用 |
2023年08月
序号 |
功能名称 |
功能描述 |
阶段 |
相关文档 |
---|---|---|---|---|
1 |
录音文件识别支持EPS,支持企业分账功能 |
录音文件识别支持通过企业项目管理(EPS)对不同用户组和用户的资源使用进行分账。企业可以根据组织架构规划不同的企业项目,并为每个企业项目设置拥有不同权限的用户组和用户,多个企业项目之间相互独立,资源分开结算。 |
商用 |
2023年06月
序号 |
功能名称 |
功能描述 |
阶段 |
相关文档 |
---|---|---|---|---|
1 |
实时语音识别增加英文模型 |
实时语音识别增加英文模型,支持英语实时语音识别。 |
商用 |
2023年03月
序号 |
功能名称 |
功能描述 |
阶段 |
相关文档 |
---|---|---|---|---|
1 |
语音交互服务CPP SDK支持Linux版本 |
实时语音识别CPP版本SDK支持linux |
商用 |
2023年01月
序号 |
功能名称 |
功能描述 |
阶段 |
相关文档 |
---|---|---|---|---|
1 |
语音合成支持SSML标记语言 |
语音合成服务支持使用SSML控制断句分词方式、发音、速度、停顿、声调和音量特征,相比文本输入提供更好的操作灵活性。 |
商用 |
2022年11月
序号 |
功能名称 |
功能描述 |
阶段 |
相关文档 |
---|---|---|---|---|
1 |
语音合成API上线知性女生、沉稳男生、利落纯英文等多种音色 |
语音合成API支持将用户输入的文字合成为音频。通过音色选择、自定义音量、语速,为企业和个人提供个性化的发音服务。 |
商用 |
2022年10月
序号 |
功能名称 |
功能描述 |
阶段 |
相关文档 |
---|---|---|---|---|
1 |
录音文件识别支持四川话识别 |
录音文件识别API可以通过将property参数设置为sichuan_8k_common实现四川话识别,支持cn-north-4,cn-east-3区域。 |
商用 |
2022年08月
序号 |
功能名称 |
功能描述 |
阶段 |
相关文档 |
---|---|---|---|---|
1 |
实时语音合成支持Python、JAVA SDK |
实时语音合成提供实时流式语音合成。用户每次建立连接,发送待合成文本,服务端将合成结果响应给用户。 |
商用 |
2022年07月
序号 |
功能名称 |
功能描述 |
阶段 |
相关文档 |
---|---|---|---|---|
1 |
实时语音识别支持C++ SDK |
实时语音识别上线C++ SDK |
商用 |
2022年06月
序号 |
功能名称 |
功能描述 |
阶段 |
相关文档 |
---|---|---|---|---|
1 |
实时语音合成支持温柔女声、朝气男声精品发音人 |
实时语音合成API,支持合成温柔女声、朝气男声。 |
商用 |
2022年05月
序号 |
功能名称 |
功能描述 |
阶段 |
相关文档 |
---|---|---|---|---|
1 |
语音合成新增朝气男声发音人 |
语音合成API支持合成气男声发音人。 |
商用 |
2022年02月
序号 |
功能名称 |
功能描述 |
阶段 |
相关文档 |
---|---|---|---|---|
1 |
录音文件识别API输入参数兼容公网访问的url |
录音文件识别约束增加音频转写时长参考。同时,输入参数兼容公网访问的url。 |
商用 |
2021年04月
序号 |
功能名称 |
功能描述 |
阶段 |
相关文档 |
---|---|---|---|---|
1 |
录音文件识别支持银行、保险领域文件识别 |
录音文件识别支持银行领域(chinese_8k_bank)和保险领域(chinese_8k_insurance)的文件识别。 实时语音转写支持采样率为16k的庭审会议(chinese_16k_court)实时语音转写和采样率为16k的IT会议(chinese_16k_it)实时语音转写。 |
商用 |
|
2 |
一句话识别、录音文件识别和实时语音转写支持输出分词结果 |
将语音识别结果中输出分词结果信息。 当取值设置为 yes 时,返回的识别结果中除了一句话的文字,同时将这句话进行分词,并且给出每个分词起始和结束的时间,这样就可以进行进一步的操作,例如建立倒排索引,以便于进行多媒体信息检索等。 |
商用 |