更新时间:2024-05-08 GMT+08:00
分享

录音文件识别

  • 支持“华北-北京四”“华东-上海一”区域。

    当前语音服务仅支持北京和上海区域,后续会陆续上线其他区域。

    • 华北-北京四,推荐的区域。
    • 华东-上海一,推荐的区域。
  • 支持pcm16k16bit、pcm8k16bit、ulaw16k8bit、ulaw8k8bit、alaw16k8bit、alaw8k8bit、WAV(支持pcm/ulaw/alaw/adpcm编码格式)、MP3、M4A、ogg-speex、ogg-opus、AMR等多种格式,详见API参考文档中的“audio_format取值范围”
  • 语音时长不超过5小时,文件大小不超过300M,用户的识别任务在6小时内完成并返回识别结果,识别结果保存72小时(从转写完成的时间算起)。
  • 支持中文普通话、四川话识别。

相关文档