更新时间:2025-09-16 GMT+08:00
分享

音频类数据集格式要求

ModelArts Studio大模型开发平台支持创建音频类数据集,创建时可导入多种形式的数据,具体格式要求详见表1

表1 音频类数据集格式要求

文件内容

文件格式

文件要求

音频

音频+jsonl(可选)

  • 音频格式支持:mp3、flac、wav、opus、aac、m4a格式,允许放在根目录或下层目录中。

    标注文件格式:可选,格式为UTF-8编码的jsonl文件,每一行描述一个音频文件在数据集中的相对路径以及其它信息。

  • 从OBS导入:单个文件大小不超过50GB,文件数量不限制。

示例如下所示:

具体的jsonl标注文件参考:

{"audio_name":"dir/16k_16bit_1channel_2s.flac","caption":"1"}
{"audio_name":"dir/16k_16bit_1channel_2s.mp3","caption":"2"}
{"audio_name":"dir/16k_16bit_1channel_2s.opus","caption":"3"}
{"audio_name":"dir/16k_16bit_1channel_2s.wav","caption":"4"}

相关文档