语音交互服务 SIS
语音交互服务 SIS
- 最新动态
- 服务公告
- 产品介绍
- 快速入门
- 用户指南
- SDK参考
- API参考
-
常见问题
- 产品咨询类
- 计费类
-
API使用类
- 如何查看接口调用量
- 为什么WebSocket一直连接不成功
- 为什么会出现识别结果非常差的情况
- 如何使用Websocket调用实时语音识别
- 有哪些途径可以使用语音交互的API
- 返回状态正常,但识别结果为空
- Token消息体中user name,domain name和project name分别指的是什么
- 如何调整并发
- 为什么录音文件识别出现重复转写结果
- 调用语音交互的API显示auth failed
- 调用语音交互的API超时怎么处理(connect timeout)
- 为什么服务端返回OBS链接不可用(data url is unreachable)
- 语音合成的base64编码如何使用
- 录音文件识别多久可以返回结果
- 语音合成能不能支持返回立体音(双声道)格式的音频
- 如何解决“The silence time is too long, and the audio will not be recognized”报错
- Token怎么获取
- 如何申请公测
- 如何修改发音人
- 实时语音识别多人同时使用,如何区分各自识别结果
- 使用HTML5 Websocket API发送websocket请求如何携带token
- 如何查看实时语音识别的中间结果
- SDK使用类
- 错误码类
- 部署类
- 区域与可用区
- 权限类
- 服务声明类
- 文档下载
- 通用参考
链接复制成功!
识别结果响应
服务端在收到客户端发送的连续音频数据后, 当服务端识别出结果后会实时向客户端按句推送识别结果响应消息, 以json字符串形式放置在text message中。
响应消息
参数名 |
参数类型 |
说明 |
---|---|---|
resp_type |
String |
响应类型。参数值为RESULT,表示识别结果响应。 |
trace_id |
String |
服务内部的令牌,可用于在日志中追溯具体流程。 |
segments |
Array of objects |
多句结果。 请参考表 segment 数据结构。 |
参数名 |
参数类型 |
说明 |
---|---|---|
start_time |
Integer |
相对时间戳,表示一句的起始,单位为ms。 |
end_time |
Integer |
相对时间戳,表示一句的结束,单位为ms。 |
is_final |
Boolen |
输出是否为最终结果。 true表示是最终结果, false表示为中间临时结果。 |
result |
Object |
调用成功表示识别结果,调用失败时无此字段。 请参考表 result数据结构。 |
参数名 |
参数类型 |
说明 |
---|---|---|
text |
String |
识别结果。 |
score |
Float |
识别结果的置信度,取值范围:0~1。此值会在实时识别中不断刷新,直到返回最终结果。 临时结果的置信度作用不是太大,请勿过多依赖此值。 |
word_info |
Array of Object |
分词输出列表。 |
参数名 |
是否必选 |
参数类型 |
说明 |
---|---|---|---|
start_time |
否 |
Integer |
起始时间 |
end_time |
否 |
Integer |
结束时间 |
word |
否 |
String |
分词 |
示例
{ "resp_type": "RESULT", "trace_id": "567e8537-a89c-13c3-a882-826321939651", "segments": [ { "start_time": 100, "end_time": 1500, "is_final": false, "result": { "text": "第一句中间结果", "word_info": [ { "start_time": 100, "end_time": 800, "word": "第一" }, { "start_time": 800, "end_time": 1000, "word": "句" }, { "start_time": 1000, "end_time": 1500, "word": "结果" } ], "score": 0.0 }, }, ] }
状态码
状态码请参见状态码。
错误码
错误码请参见错误码。
父主题: 实时语音识别响应