更新时间:2024-05-08 GMT+08:00
分享

实时语音识别

  • 支持“华北-北京四”“华东-上海一”区域。

    当前服务仅支持北京和上海区域,后续会陆续上线其他区域。

    • 华北-北京四,推荐的区域,支持一句话识别、录音文件识别、实时语音识别和语音合成和热词等接口。
    • 华东-上海一,推荐的区域,支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。
  • 音频采样率8KHz或者16KHz,采样位数8bit或者16bit。
  • 支持中文普通话、方言和英语的语音识别,其中方言包括:四川话、粤语和上海话。
  • 方言和英语仅支持“华北-北京四”区域。
  • 端点检测参数(vad_head、vad_tail、max_seconds)会影响句子的分段结果,存在一定误差。对连续模式和单句模式生效,对流式一句话模式无效。

相关文档