音频标注数据集文件说明
OCTOPUS格式文件基本要求(音频标注)
上传的OCTOPUS格式数据集需包含以下文件(以mp3格式为例)。音频文件支持的格式包含:wav、mp3、flac、m4a。
.
├─ 文件夹1
├─ audio1.mp3 #音频文件
├─ audio1.json #该音频文件的所有标注信息
├─ 文件夹2
├─ audio2.mp3 #音频文件
├─ audio2.json #该音频文件的所有标注信息
标注数据.json文件说明
数据集中必含“.json”文件,用于集合该音频文件的所有标注数据信息,包括该音频所在的项目id、数据包id、音频上所有标注信息等。上传数据集前请保证“.json”文件内容正确。“.json”文件编写的参考样例如下:
{
"frame_id": 1,
#帧序号
"batch_task_id": 1368,
#批次任务id
"project_id": "ee...3d",
#资源域ID
"label_mode": "manual",
#标注类型:auto和manual两种
"status": "labeled",
#标注任务状态:unlabeled、labeled、unconfirmed、confirmed、all五种
"sample_type": "AUDIO",
#样本类型:包含“IMAGE”,“POINT_CLOUD”,“AUDIO”,“TEXT”
"des_order": "",
#此份数据对应的原始数据包描述
"tag_names": [],
#标签名称
"valid": true,
#是否有效,包含“true”和“false”两种
"create_time": 1708657733087,
#标注的创建时间
"difficult": false,
#是否难例,包含“true”难例和“false”非难例
"label_counts": [
#各类标注物的个数统计
{
"label_meta_id": 7900,
#标注物使用的标签ID
"label_num": 1,
#标注物个数
"label_meta_name": "奇怪的声音1",
#标注物名称
"label_meta_desc": "1233",
#标注物描述
"label_meta_attr": "{\"声音1\":\"2333,4444\",\"声音2\":\"334455,1121333\"}",
#标注物额外属性
"label_meta_shape": "audio",
#标注物形状,包含“bndbox、line、circle、polygon、points、dashed、cube_3d、multiBox、polygon_3d_v2、audio、text”
"label_meta_color": "#496832",
#标注物颜色信息
"level": 0
},
{
"label_meta_id": 7901,
"label_num": 1,
"label_meta_name": "噪声",
"label_meta_desc": "11",
"label_meta_attr": "{\"text1\":\"111,222,333\",\"额鹅鹅鹅\":\"1111,333\"}",
"label_meta_shape": "audio",
"label_meta_color": "#391c1c",
"level": 0
}
],
"audio_meta_info": {
#音频信息
"id": "49...bd",
"name": "0000.mp3",
#音频名称
"source": "https://octopus-raw-ee.../label-data/task-1368/data/mp3/0000.mp3",
#音频源的obs路径url
"duration": "180.0s"
#音频时长
},
"label_task_id": 1691,
#批次子任务ID
"partitionId": 20240222,
"label_update_time": 1708944569975,
#标注最近更新时间
"prefix_folder": "mp3",
"image_id": "88...91",
"inspection": 0,
"labels": [
{
"label_meta_id": 7900,
#标注物对应的标签ID
"create_time": 0,
"shape_type": "audio",
#标注物形状
"serial_number": 1,
#该帧中标注物唯一自增id
"label_object_id": -1,
"attribute": "{\"声音1\":\"2333\"}",
#标注物属性
"audio": {
#音频子段落标注信息
"xmin": 48.957073,
#段落开始时间
"xmax": 80.938614,
#段落结束时间
"gender": "MALE",
#讲话人性别, 允许不存在此字段
"author": "role1",
#讲话人角色, 允许不存在此字段
"text": "aaaaabbb"
#音频对应的文本
},
"label_meta_name": "奇怪的声音1"
#标注物名称
},
{
"label_meta_id": 7901,
"create_time": 0,
"shape_type": "audio",
"serial_number": 2,
"label_object_id": -1,
"attribute": "{}",
"audio": {
"xmin": 126.331764,
"xmax": 138.0552
},
"label_meta_name": "噪声"
}
]
}
必须字段样例
数据集可视化
“.json”文件中必须包含label_counts和labels字段信息。
创建标注任务
“.json”文件中必须包含label_counts和labels字段信息。如果需要json文件中已有的标注信息在平台上直接展示,则label_counts里面的标注物名称、描述、形状、额外属性需要和创建任务使用的平台标签信息保持一致。示例如下:
{
"label_counts": [
#各类标注物的个数统计
{
"label_meta_id": 7900,
#标注物使用的标签ID
"label_num": 1,
#标注物个数
"label_meta_name": "奇怪的声音1",
#标注物名称
"label_meta_desc": "1233",
#标注物描述
"label_meta_attr": "{\"声音1\":\"2333,4444\",\"声音2\":\"334455,1121333\"}",
#标注物额外属性
"label_meta_shape": "audio",
#标注物形状
"label_meta_color": "#496832"
#标注物颜色信息
}
],
"labels": [
{
"label_meta_id": 7900,
"shape_type": "audio",
"serial_number": 1,
"attribute": "{\"声音1\":\"2333\"}",
"audio": {
"xmin": 48.957073,
"xmax": 80.938614,
"gender": "MALE",
"author": "role1",
"text": "aaaaabbb"
},
"label_meta_name": "奇怪的声音1"
}
]
}