更新时间:2024-05-30 GMT+08:00
分享

创建数据处理任务版本

功能介绍

创建数据处理任务版本。

调试

您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。

URI

POST /v2/{project_id}/processor-tasks/{task_id}/versions

表1 路径参数

参数

是否必选

参数类型

描述

project_id

String

用户项目ID。获取方法请参见获取项目ID和名称

task_id

String

数据处理任务ID。

请求参数

表2 请求Body参数

参数

是否必选

参数类型

描述

create_version

Boolean

创建任务时是否同步创建一个任务版本。可选值如下:

  • true:创建任务时同步创建一个任务版本

  • false:创建任务时不创建任务版本(默认值)

data_source

ProcessorDataSource object

数据来源,与inputs二选一。

description

String

数据处理任务描述,长度为0-256位,不能包含^!<>=&"'特殊字符。

inputs

Array of ProcessorDataSource objects

数据来源列表,与data_source二选一。

name

String

数据处理任务名称。

template

TemplateParam object

数据处理模板,如算法ID和参数等。

version_id

String

数据集版本ID。

work_path

WorkPath object

数据处理任务的工作目录。

workspace_id

String

工作空间ID。未创建工作空间时默认值为“0”,存在创建并使用的工作空间,以实际取值为准。

表3 ProcessorDataSource

参数

是否必选

参数类型

描述

name

String

数据集的名称。

source

String

数据源所在路径。可选值如下:

  • 如果type是OBS,source为OBS路径。

  • 如果type是TASK,source为任务ID。

  • 如果type是DATASET,source为数据集ID。

  • 如果type是CUSTOM且是资源租户调用,source为真实用户的project_id, 否则不需要这个字段。

type

String

数据源类型。可选值如下:

  • OBS:数据来源于OBS

  • TASK:数据处理任务

  • DATASET:数据集

  • CUSTOM:资源租户调用

version_id

String

数据集的版本。

version_name

String

数据集的版本名称。

表4 TemplateParam

参数

是否必选

参数类型

描述

id

String

任务类型,即数据处理模板ID。可选值如下:

  • sys_data_analyse:特征分析

  • sys_data_cleaning:数据清洗

  • sys_data_augmentation:数据增强

  • sys_data_validation:数据校验

  • sys_data_selection:数据筛选

name

String

模板名称。

operator_params

Array of OperatorParam objects

算子的参数列表。

表5 OperatorParam

参数

是否必选

参数类型

描述

advanced_params_switch

Boolean

高级参数开关。

id

String

算子ID。

name

String

算子名称。

params

Object

算子参数,参数类型是map<string,object>,object目前只支持Boolean、Integer、Long、String、List[/topic/body/section/table/tgroup/tbody/row/entry/p/br {""}) (br]、Map<String,String>类型。对于数据预处理任务比较特殊的两个场景物体检测和图像分类,键“task_type”对应的值为“object_detection”或“image_classification”。

表6 WorkPath

参数

是否必选

参数类型

描述

name

String

数据集的名称。

output_path

String

输出路径,例如/datasets/demo。

path

String

工作路径。可选值如下:

  • 如果type是OBS,source为OBS路径。

  • 如果type是DATASET,source为数据集ID。

type

String

工作路径的类型。可选值如下:

  • OBS:OBS路径

  • DATASET:数据集

version_id

String

数据集的版本。

version_name

String

数据集的版本名称,名称仅包含数字、字母、中划线和下划线,长度是0-32位。

响应参数

状态码: 200

表7 响应Body参数

参数

参数类型

描述

version_id

String

数据处理任务的版本ID。

请求示例

创建数据校验任务的版本。设置任务名称为“PRE-e77c”。

{
  "name" : "PRE-e77c",
  "inputs" : [ {
    "type" : "DATASET",
    "source" : "PYc9H2HGv5BJNwBGXyK",
    "version_id" : "Osc8SZ7TZStiRV4vYkZ"
  } ],
  "work_path" : {
    "type" : "DATASET",
    "path" : "PYc9H2HGv5BJNwBGXyK",
    "version_name" : "V0011"
  },
  "description" : "",
  "template" : {
    "id" : "sys_data_validation",
    "operator_params" : [ {
      "name" : "MetaValidation",
      "advanced_params_switch" : false,
      "params" : {
        "task_type" : "image_classification",
        "dataset_type" : "manifest",
        "source_service" : "select",
        "filter_func" : "data_validation_select",
        "image_max_width" : "1920",
        "image_max_height" : "1920",
        "total_status" : "[0,1,2]"
      }
    } ]
  },
  "workspace_id" : "0"
}

响应示例

状态码: 200

OK

{
  "version_id" : "qSaudx2sbPvthHygckA"
}

状态码

状态码

描述

200

OK

401

Unauthorized

403

Forbidden

404

Not Found

错误码

请参见错误码

相关文档