更新时间:2022-04-26 GMT+08:00
分享

事件响应

服务器端检测到某些事件时,会给出如下响应消息,以json字符串形式放置在text message中。

响应消息

表1 响应参数

参数名

参数类型

说明

resp_type

String

参数值为EVENT,表示开始识别响应。

trace_id

String

服务内部的令牌,可用于在日志中追溯具体流程。

event

String

具体的事件,详细参数可参见event取值范围及其说明

timestamp

Integer

保留字段。将来会用于此事件发生的具体时间,以会话开始作为0点,单位为ms。

event取值范围及其说明

表2 event取值范围

事件

说明

VOICE_START

检测到句子开始。

VOICE_END

检测到句子结束。

EXCEEDED_SILENCE

静音超长,也即没有检测到声音。

EXCEEDED_AUDIO

输入音频超长。指一通会话的总的音频长度大于后台配置的最大允许长度(比如5h)。

  • 在流式一句话模式下:
    • 不会返回VOICE_START、VOICE_END、EXCEEDED_SILCENCE事件。
    • 返回EXCEEDED_AUDIO事件后,后续音频将被忽略,不会再识别。
  • 在实时语音识别单句模式下:
    • 返回VOICE_START事件,表示检测到语音,此时IVR可以做打断。
    • 返回VOICE_END事件后,表示一句话结束,后续的音频将被忽略,不会再进行识别。
    • 只会返回最多一组VOICE_START和VOICE_END事件。
    • 如果返回EXCEEDED_SILENCE事件,表示超过vad_head没有检测到声音,通常表示用户一直没有说话。此时后续的音频将被忽略,不会再进行识别。
    • 返回EXCEEDED_AUDIO事件后,后续音频将被忽略,不会再识别。
  • 在实时语音识别连续模式下:
    • 不会返回VOICE_START、VOICE_END、EXCEED_SLIENCE事件。
    • 返回EXCEEDED_AUDIO事件后,后续音频将被忽略,不会再识别。

示例

{
  "resp_type": "EVENT",
  "trace_id": "567e8537-a89c-13c3-a882-826321939651",
  "event": "VOICE_END",
  "timestamp": 1500
}

状态码

状态码请参见状态码

错误码

错误码请参见错误码

分享:

    相关文档

    相关产品

关闭导读