更新时间:2025-09-18 GMT+08:00

实时语音识别

  • 支持“亚太-新加坡”“中东-利雅得”区域。
  • 音频采样率8KHz或者16KHz,采样位数8bit或者16bit。
  • 支持中文普通话、英语、阿拉伯语识别。
  • 端点检测参数(vad_head、vad_tail、max_seconds)会影响句子的分段结果,存在一定误差。对连续模式和单句模式生效,对流式一句话模式无效。