创建数据集导出任务
功能介绍
创建数据集导出任务,可导出至OBS或新数据集。
调试
您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。
URI
POST /v2/{project_id}/datasets/{dataset_id}/export-tasks
参数 | 是否必选 | 参数类型 | 描述 |
|---|---|---|---|
dataset_id | 是 | String | 数据集ID。 |
project_id | 是 | String | 用户项目ID。获取方法请参见获取项目ID和名称。 |
请求参数
参数 | 是否必选 | 参数类型 | 描述 |
|---|---|---|---|
annotation_format | 否 | String | 标注格式。当前可取以下值:
|
export_format | 否 | Integer | 导出的目录格式。可选值如下:
|
export_params | 否 | ExportParams object | 导出数据集任务的参数。 |
export_type | 否 | Integer | 导出类型。可选值如下:
|
path | 否 | String | 导出到OBS的输出路径。导出数据到OBS或者导出为新的数据集时该参数必传。 |
sample_state | 否 | String | 样本状态。可选样本状态如下:
|
source_type_header | 否 | String | 指定导出标注文件中的OBS路径前缀,默认为“obs://”,支持指定“s3://”。由于训练无法解析以“obs”开头图片路径,需要导出manifest中的路径前缀为“s3://”。 |
status | 否 | Integer | 任务状态。 |
task_id | 否 | String | 任务ID。 |
version_format | 否 | String | 数据集版本格式。可选值如下:
|
version_id | 否 | String | 数据集版本ID。当导出数据集某一版本的数据时,需要指定该参数。 |
with_column_header | 否 | Boolean | 导出时是否将列名写到CSV文件的第一行,对于表格数据集有效。可选值如下:
|
参数 | 是否必选 | 参数类型 | 描述 |
|---|---|---|---|
clear_hard_property | 否 | Boolean | 是否清空难例属性。可选值如下:
|
export_dataset_version_format | 否 | String | 导出数据集版本的格式。 |
export_dataset_version_name | 否 | String | 导出数据集版本的名称。 |
export_dest | 否 | String | 数据集导出类型。可选值如下:
|
export_new_dataset_name | 否 | String | 导出新数据集的名称。 |
export_new_dataset_work_path | 否 | String | 导出新数据集的工作目录。 |
ratio_sample_usage | 否 | Boolean | 指定切分比例后,是否按指定比例随机分配训练-验证集。可选值如下:
|
sample_state | 否 | String | 样本状态。可选样本状态如下:
|
samples | 否 | Array of strings | 导出的样本ID列表。 |
search_conditions | 否 | Array of SearchCondition objects | 导出的筛选条件,多个条件之间是或(OR)关系。 |
train_sample_ratio | 否 | String | 指定发布版本时训练集-验证集的切分比例,默认为1.00,即全部分为训练集。 |
参数 | 是否必选 | 参数类型 | 描述 |
|---|---|---|---|
coefficient | 否 | String | 根据难度系数筛选。 |
frame_in_video | 否 | Integer | 视频中某帧。 |
hard | 否 | String | 样本级别是否难例。可选值如下:
|
import_origin | 否 | String | 根据数据来源筛选。 |
kvp | 否 | String | CT剂量,通过剂量来筛选。 |
label_list | 否 | SearchLabels object | 标签搜索条件。 |
labeler | 否 | String | 标注人。 |
metadata | 否 | SearchProp object | 通过样本属性搜索。 |
parent_sample_id | 否 | String | 父样本ID。 |
sample_dir | 否 | String | 根据样本所在目录搜索(目录需要以/结尾),只搜索指定目录下的样本,不支持目录递归搜索。 |
sample_name | 否 | String | 根据样本名称搜索(含后缀名)。 |
sample_time | 否 | String | 样本加入到数据集时,会根据样本在OBS上的最后修改时间(精确到天)建立索引,此处可以根据此时间进行搜索。可选值如下:
|
score | 否 | String | 根据置信度筛选。 |
slice_thickness | 否 | String | DICOM层厚,通过层厚筛选样本。 |
study_date | 否 | String | DICOM扫描时间。 |
time_in_video | 否 | String | 视频中某个时间。 |
参数 | 是否必选 | 参数类型 | 描述 |
|---|---|---|---|
labels | 否 | Array of SearchLabel objects | 标签搜索条件列表。 |
op | 否 | String | 如要搜索多个标签,则op需要有值;如果只搜索一个标签,则无需指定op的值。可选值如下:
|
参数 | 是否必选 | 参数类型 | 描述 |
|---|---|---|---|
name | 否 | String | 标签名。 |
op | 否 | String | 多个属性之间的操作类型。可选值如下:
|
property | 否 | Map<String,Array<String>> | 标签属性,是Object格式,存放任意的键值对;key是属性名称,value是取值列表,如value为null表示不根据值搜索,否则搜索的值满足列表中任意一个即可。 |
type | 否 | Integer | 标签类型。可选值如下:
|
响应参数
状态码: 200
参数 | 参数类型 | 描述 |
|---|---|---|
create_time | Long | 任务创建时间。 |
error_code | String | 错误码。 |
error_msg | String | 错误信息。 |
export_format | Integer | 导出的目录格式。可选值如下:
|
export_params | ExportParams object | 导出数据集任务的参数。 |
export_type | Integer | 导出类型。可选值如下:
|
finished_sample_count | Integer | 已完成的样本数量。 |
path | String | 导出的输出路径。 |
progress | Float | 任务当前进度百分比。 |
status | String | 任务状态。可选值如下:
|
task_id | String | 任务ID。 |
total_sample_count | Integer | 样本总数量。 |
update_time | Long | 任务更新时间。 |
version_format | String | 数据集版本格式。可选值如下:
|
version_id | String | 数据集版本ID。 |
参数 | 参数类型 | 描述 |
|---|---|---|
clear_hard_property | Boolean | 是否清空难例属性。可选值如下:
|
export_dataset_version_format | String | 导出数据集版本的格式。 |
export_dataset_version_name | String | 导出数据集版本的名称。 |
export_dest | String | 数据集导出类型。可选值如下:
|
export_new_dataset_name | String | 导出新数据集的名称。 |
export_new_dataset_work_path | String | 导出新数据集的工作目录。 |
ratio_sample_usage | Boolean | 指定切分比例后,是否按指定比例随机分配训练-验证集。可选值如下:
|
sample_state | String | 样本状态。可选样本状态如下:
|
samples | Array of strings | 导出的样本ID列表。 |
search_conditions | Array of SearchCondition objects | 导出的筛选条件,多个条件之间是或(OR)关系。 |
train_sample_ratio | String | 指定发布版本时训练集-验证集的切分比例,默认为1.00,即全部分为训练集。 |
参数 | 参数类型 | 描述 |
|---|---|---|
coefficient | String | 根据难度系数筛选。 |
frame_in_video | Integer | 视频中某帧。 |
hard | String | 样本级别是否难例。可选值如下:
|
import_origin | String | 根据数据来源筛选。 |
kvp | String | CT剂量,通过剂量来筛选。 |
label_list | SearchLabels object | 标签搜索条件。 |
labeler | String | 标注人。 |
metadata | SearchProp object | 通过样本属性搜索。 |
parent_sample_id | String | 父样本ID。 |
sample_dir | String | 根据样本所在目录搜索(目录需要以/结尾),只搜索指定目录下的样本,不支持目录递归搜索。 |
sample_name | String | 根据样本名称搜索(含后缀名)。 |
sample_time | String | 样本加入到数据集时,会根据样本在OBS上的最后修改时间(精确到天)建立索引,此处可以根据此时间进行搜索。可选值如下:
|
score | String | 根据置信度筛选。 |
slice_thickness | String | DICOM层厚,通过层厚筛选样本。 |
study_date | String | DICOM扫描时间。 |
time_in_video | String | 视频中某个时间。 |
参数 | 参数类型 | 描述 |
|---|---|---|
labels | Array of SearchLabel objects | 标签搜索条件列表。 |
op | String | 如要搜索多个标签,则op需要有值;如果只搜索一个标签,则无需指定op的值。可选值如下:
|
参数 | 参数类型 | 描述 |
|---|---|---|
name | String | 标签名。 |
op | String | 多个属性之间的操作类型。可选值如下:
|
property | Map<String,Array<String>> | 标签属性,是Object格式,存放任意的键值对;key是属性名称,value是取值列表,如value为null表示不根据值搜索,否则搜索的值满足列表中任意一个即可。 |
type | Integer | 标签类型。可选值如下:
|
请求示例
创建导出(导出到OBS)任务
{ "path" : "/test-obs/daoChu/", "export_type" : 3, "export_params" : { "sample_state" : "", "export_dest" : "DIR" } }创建导出(导出新数据集)任务
{ "path" : "/test-obs/classify/input/", "export_type" : 3, "export_params" : { "sample_state" : "", "export_dest" : "NEW_DATASET", "export_new_dataset_name" : "dataset-export-test", "export_new_dataset_work_path" : "/test-obs/classify/output/" } }
响应示例
状态码: 200
OK
{
"task_id" : "rF9NNoB56k5rtYKg2Y7"
} 状态码
状态码 | 描述 |
|---|---|
200 | OK |
401 | Unauthorized |
403 | Forbidden |
404 | Not Found |
错误码
请参见错误码。

