更新时间:2022-11-24 GMT+08:00

创建数据集版本

为数据集创建新的版本。

dataset.create_version(name=None, version_format=None, label_task_type=None, label_task_id=None, **kwargs)

示例代码

示例一:为数据集创建新的版本
from modelarts.session import Session
from modelarts.dataset import Dataset
session = Session()

dataset = Dataset(session, dataset_id)
create_version_resp = dataset.create_version(name="V001", version_format="Default", label_task_type=0, description="version 001")

示例二:基于标注任务创建数据集

from modelarts.session import Session
from modelarts.dataset import Dataset
session = Session()

dataset = Dataset(session, dataset_id)
create_version_resp = dataset.create_version(label_task_id="IbAhFai5KXWC3gthUfz", description="dataset version from label task")

参数说明

表1 请求参数

参数

是否必选

参数类型

描述

name

String

版本名称,必须是中文、字母、数字、下划线或中划线组成的合法字符串,长度为1-32位。

version_format

String

数据集版本格式。可选值如下:

  • Default:默认格式

label_task_type

Integer

版本数据对应的标注类型。可选值如下:

  • 0:图像分类
  • 1:物体检测
  • 3:图像分割
  • 100:文本分类
  • 101:命名实体
  • 102:文本三元组
  • 200:声音分类
  • 201:语音内容
  • 202:语音分割
  • 400:表格数据集
  • 600:视频标注
  • 900:自由格式

label_task_id

String

基于标注任务创建数据集版本,标注任务ID。

description

String

版本描述信息,默认为空,长度为0-256位,不能包含!<>=&"'特殊字符。