更新时间:2025-07-02 GMT+08:00

音频类数据集格式要求

ModelArts Studio大模型开发平台支持创建音频类数据集,创建时可导入多种形式的数据,具体格式要求详见表1

表1 音频类数据集格式要求

文件内容

文件格式

文件要求

仅音频

音频

  • 格式支持:mp3、flac、wav、opus、aac、m4a。所有音频可以放在多个文件夹下,每个文件夹下可以同时包含多种格式的音频。
  • 从OBS导入:单个文件大小不超过50GB,文件数量不限制。

音频+标注

音频+jsonl

  • 音频格式支持:mp3、flac、wav、opus、aac、m4a。

    标注文件格式:jsonl。

  • 从OBS导入:单个文件大小不超过50GB,文件数量不限制。

示例如下所示:

具体的jsonl标注文件参考:

{"audio_name":"dir/16k_16bit_1channel_2s.flac","caption":"1"}
{"audio_name":"dir/16k_16bit_1channel_2s.mp3","caption":"2"}
{"audio_name":"dir/16k_16bit_1channel_2s.opus","caption":"3"}
{"audio_name":"dir/16k_16bit_1channel_2s.wav","caption":"4"}