- 最新动态
- 服务公告
- 产品介绍
- 快速入门
- 用户指南
- SDK参考
- API参考
-
常见问题
- 产品咨询类
- 计费类
-
API使用类
- 如何查看接口调用量
- 为什么WebSocket一直连接不成功
- 为什么会出现识别结果非常差的情况
- 如何使用Websocket调用实时语音识别
- 有哪些途径可以使用语音交互的API
- 返回状态正常,但识别结果为空
- Token消息体中user name,domain name和project name分别指的是什么
- 如何调整并发
- 为什么录音文件识别出现重复转写结果
- 调用语音交互的API显示auth failed
- 调用语音交互的API超时怎么处理(connect timeout)
- 为什么服务端返回OBS链接不可用(data url is unreachable)
- 语音合成的base64编码如何使用
- 录音文件识别多久可以返回结果
- 语音合成能不能支持返回立体音(双声道)格式的音频
- 如何解决“The silence time is too long, and the audio will not be recognized”报错
- Token怎么获取
- 如何申请公测
- 如何修改发音人
- 实时语音识别多人同时使用,如何区分各自识别结果
- 使用HTML5 Websocket API发送websocket请求如何携带token
- 如何查看实时语音识别的中间结果
- SDK使用类
- 错误码类
- 部署类
- 区域与可用区
- 权限类
- 服务声明类
- 文档下载
- 通用参考
链接复制成功!
SDK简介
语音交互概述
语音交互服务(Speech Interaction Service,简称SIS)是一种人机交互方式,用户通过实时访问和调用API获取语音交互结果。支持用户通过语音识别功能,将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本,同时也支持通过语音合成功能将文本转换成逼真的语音等提升用户体验。适用场景如语音客服质检、会议记录、语音短消息、有声读物、电话回访等。
SDK概述
- 优先推荐使用新版SDK语音交互服务SDK,该SDK基于统一规范开发,支持Java/Python/C++/.NET/Go/NodeJs/PHP,使用方法可参考api-explorer。该SDK暂不支持websocket方法。
- 如果需要使用实时语音识别,可考虑使用替代SDK,当前支持Java SDK、Python SDK、CPP SDK、iOS SDK、Android SDK。使用方法可参考Java SDK、Python SDK、CPP SDK(Windows)、CPP SDK(Linux)。后序章节均指代该SDK。
Java接口与API对应关系
Java接口与API对应关系请参见表 Java接口与API对应关系表。
Class |
Method |
API |
功能名称 |
---|---|---|---|
RasrClient |
void continueStreamConnect(RasrRequest request) |
wss://{endpoint}/v1/{project_id}/rasr/continue-stream |
实时流连续模式 |
void shortStreamConnect(RasrRequest request) |
wss://{endpoint}/v1/{project_id}/rasr/short-stream |
实时流一句话模式 |
|
void sentenceStreamConnect(RasrRequest request) |
wss://{endpoint}/v1/{project_id}/rasr/sentence-stream |
实时流单句模式 |
|
AsrCustomizationClient |
AsrCustomShortResponse getAsrShortResponse(AsrCustomShortRequest request) |
POST /v1/{project_id}/asr/short-audio |
一句话识别 |
String submitJob(AsrCustomLongRequest request) |
POST /v1/{project_id}/asr/transcriber/jobs |
录音文件识别-提交请求 |
|
AsrCustomLongResponse getAsrLongResponse(String jobId) |
GET /v1/{project_id}/asr/transcriber/jobs/{job_id} |
录音文件识别-状态查询 |
|
TtsCustomizationClient |
TtsCustomResponse getTtsResponse(TtsCustomRequest request) |
POST /v1/{project_id}/tts |
语音合成 |
HotWordClient |
String create(HotWordRequest request) |
POST /v1/{project_id}/asr/vocabularies |
创建热词表 |
String update(HotWordRequest request, String vocabularyId) |
PUT /v1/{project_id}/asr/vocabularies/{vocabulary_id} |
更新热词表 |
|
HotWordResponse query(String vocabularyId) |
GET /v1/{project_id}/asr/vocabularies/{vocabulary_id} |
查询热词表信息 |
|
HotWordsResponse query() |
GET /v1/{project_id}/asr/vocabularies |
查询热词表列表 |
|
void delete(String vocabularyId) |
DELETE /v1/{project_id}/asr/vocabularies/{vocabulary_id} |
删除热词表 |
Python接口与API对应关系
Python接口与API对应关系请参见表 Python接口与API对应关系表。
Class |
Method |
API |
功能名称 |
---|---|---|---|
RasrClient |
continue_stream_connect(request) |
wss://{endpoint}/v1/{project_id}/rasr/continue-stream |
实时流连续模式 |
short_stream_connect(request) |
wss://{endpoint}/v1/{project_id}/rasr/short-stream |
实时流一句话模式 |
|
sentence_stream_connect(request) |
wss://{endpoint}/v1/{project_id}/rasr/sentence-stream |
实时流单句模式 |
|
AsrCustomizationClient |
get_short_response(request) |
POST /v1/{project_id}/asr/short-audio |
一句话识别 |
submit_job(request) |
POST /v1/{project_id}/asr/transcriber/jobs |
录音文件识别-提交请求 |
|
get_long_response(job_id) |
GET /v1/{project_id}/asr/transcriber/jobs/{job_id} |
录音文件识别-状态查询 |
|
TtsCustomizationClient |
get_tts_response(request) |
POST /v1/{project_id}/tts |
语音合成 |
HotWordClient |
create(request) |
POST /v1/{project_id}/asr/vocabularies |
创建热词表 |
update(request, vocabulary_id) |
PUT /v1/{project_id}/asr/vocabularies/{vocabulary_id} |
更新热词表 |
|
query_by_vocabulary_id(vocabularyId) |
GET /v1/{project_id}/asr/vocabularies/{vocabulary_id} |
查询热词表信息 |
|
query() |
GET /v1/{project_id}/asr/vocabularies |
查询热词表列表 |
|
delete(vocabulary_id) |
DELETE /v1/{project_id}/asr/vocabularies/{vocabulary_id} |
删除热词表 |