音频标注数据集文件说明
OCTOPUS格式文件基本要求(音频标注)
上传的OCTOPUS格式数据集需包含以下文件(以mp3格式为例)。音频文件支持的格式包含:wav、mp3、flac、m4a。
. ├─ 文件夹1 ├─ audio1.mp3 #音频文件 ├─ audio1.json #该音频文件的所有标注信息 ├─ 文件夹2 ├─ audio2.mp3 #音频文件 ├─ audio2.json #该音频文件的所有标注信息
标注数据.json文件说明
数据集中必含“.json”文件,用于集合该音频文件的所有标注数据信息,包括该音频所在的项目id、数据包id、音频上所有标注信息等。上传数据集前请保证“.json”文件内容正确。“.json”文件编写的参考样例如下:
{ "frame_id": 1, #帧序号 "batch_task_id": 1368, #批次任务id "project_id": "ee263479089143cf9d8ca66a10ed3c3d", #资源域ID "label_mode": "manual", #标注类型:auto和manual两种 "status": "labeled", #标注任务状态:unlabeled、labeled、unconfirmed、confirmed、all五种 "sample_type": "AUDIO", #样本类型:包含“IMAGE”,“POINT_CLOUD”,“AUDIO”,“TEXT” "des_order": "", #此份数据对应的原始数据包描述 "tag_names": [], #标签名称 "valid": true, #是否有效,包含“true”和“false”两种 "create_time": 1708657733087, #标注的创建时间 "difficult": false, #是否难例,包含“true”难例和“false”非难例 "label_counts": [ #各类标注物的个数统计 { "label_meta_id": 7900, #标注物使用的标签ID "label_num": 1, #标注物个数 "label_meta_name": "奇怪的声音1", #标注物名称 "label_meta_desc": "1233", #标注物描述 "label_meta_attr": "{\"声音1\":\"2333,4444\",\"声音2\":\"334455,1121333\"}", #标注物额外属性 "label_meta_shape": "audio", #标注物形状,包含“bndbox、line、circle、polygon、points、dashed、cube_3d、multiBox、polygon_3d_v2、audio、text” "label_meta_color": "#496832", #标注物颜色信息 "level": 0 }, { "label_meta_id": 7901, "label_num": 1, "label_meta_name": "噪声", "label_meta_desc": "11", "label_meta_attr": "{\"text1\":\"111,222,333\",\"额鹅鹅鹅\":\"1111,333\"}", "label_meta_shape": "audio", "label_meta_color": "#391c1c", "level": 0 } ], "audio_meta_info": { #音频信息 "id": "4951cbcb-57ea-4367-b0e2-56b77a18e9bd", "name": "0000.mp3", #音频名称 "source": "https://octopus-raw-ee263479089143cf9d8ca66a10ed3c3d.obs.cn-north-5.myhuaweicloud.com/label-data/task-1368/data/mp3/0000.mp3", #音频源的obs路径url "duration": "180.0s" #音频时长 }, "label_task_id": 1691, #批次子任务ID "partitionId": 20240222, "label_update_time": 1708944569975, #标注最近更新时间 "prefix_folder": "mp3", "image_id": "889b33fa-8c43-4760-a215-14d299af4291", "inspection": 0, "labels": [ { "label_meta_id": 7900, #标注物对应的标签ID "create_time": 0, "shape_type": "audio", #标注物形状 "serial_number": 1, #该帧中标注物唯一自增id "label_object_id": -1, "attribute": "{\"声音1\":\"2333\"}", #标注物属性 "audio": { #音频子段落标注信息 "xmin": 48.957073, #段落开始时间 "xmax": 80.938614, #段落结束时间 "gender": "MALE", #讲话人性别, 允许不存在此字段 "author": "role1", #讲话人角色, 允许不存在此字段 "text": "aaaaabbb" #音频对应的文本 }, "label_meta_name": "奇怪的声音1" #标注物名称 }, { "label_meta_id": 7901, "create_time": 0, "shape_type": "audio", "serial_number": 2, "label_object_id": -1, "attribute": "{}", "audio": { "xmin": 126.331764, "xmax": 138.0552 }, "label_meta_name": "噪声" } ] }
必须字段样例
数据集可视化
“.json”文件中必须包含label_counts和labels字段信息。
创建标注任务
“.json”文件中必须包含label_counts和labels字段信息。如果需要json文件中已有的标注信息在平台上直接展示,则label_counts里面的标注物名称、描述、形状、额外属性需要和创建任务使用的平台标签信息保持一致。示例如下:
{ "label_counts": [ #各类标注物的个数统计 { "label_meta_id": 7900, #标注物使用的标签ID "label_num": 1, #标注物个数 "label_meta_name": "奇怪的声音1", #标注物名称 "label_meta_desc": "1233", #标注物描述 "label_meta_attr": "{\"声音1\":\"2333,4444\",\"声音2\":\"334455,1121333\"}", #标注物额外属性 "label_meta_shape": "audio", #标注物形状 "label_meta_color": "#496832" #标注物颜色信息 } ], "labels": [ { "label_meta_id": 7900, "shape_type": "audio", "serial_number": 1, "attribute": "{\"声音1\":\"2333\"}", "audio": { "xmin": 48.957073, "xmax": 80.938614, "gender": "MALE", "author": "role1", "text": "aaaaabbb" }, "label_meta_name": "奇怪的声音1" } ] }