Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Actualización más reciente 2022-11-14 GMT+08:00

Creación de una tarea de importación

Función

Esta API se utiliza para crear una tarea de importación de conjuntos de datos para importar muestras y etiquetas del sistema de almacenamiento al conjunto de datos.

URI

POST /v2/{project_id}/datasets/{dataset_id}/import-tasks

Tabla 1 Parámetros de ruta

Parámetro

Obligatorio

Tipo

Descripción

dataset_id

String

ID de conjunto de datos.

project_id

String

ID del proyecto. Para obtener más información sobre cómo obtener el ID de proyecto, consulte Obtención de un ID de proyecto.

Parámetros de solicitud

Tabla 2 Parámetros de body de solicitud

Parámetro

Obligatorio

Tipo

Descripción

data_source

No

DataSource object

Fuente de datos.

difficult_only

No

Boolean

Si importar solo ejemplos duros. Opciones:

  • true: Solo se importan muestras difíciles.
  • false: Todas las muestras se importan. (Default value)

excluded_labels

No

Array of Label objects

No importe muestras que contengan la etiqueta especificada.

final_annotation

No

Boolean

Si importar datos al estado final. Opciones:

  • true: Importar datos al estado final. (Valor predeterminado)
  • false: No importar datos al estado final.

import_annotations

No

Boolean

Si importar etiquetas. Opciones:

  • true: Importar etiquetas. (Valor predeterminado)
  • false: no importar etiquetas.

import_folder

No

String

Nombre del subdirectorio en el directorio de almacenamiento del conjunto de datos después de la importación. Puede especificar el mismo subdirectorio para varias tareas de importación para evitar la importación repetida de las mismas muestras. Este campo no es válido para los conjuntos de datos de tablas.

import_origin

No

String

Fuente de datos. Opciones:

  • obs: bucket OBS (valor predeterminado)
  • dws: GaussDB(DWS)
  • dli: DLI
  • rds: RDS
  • mrs: MRS
  • inference: Servicio de inferencia

import_path

String

Ruta OBS o ruta de manifest que se van a importar.

  • Al importar un archivo de manifiesto, asegúrese de que la ruta de acceso es precisa para el archivo de manifest.
  • Cuando una ruta de acceso se importa como un directorio, el tipo de conjunto de datos sólo puede admitir la clasificación de imágenes, la detección de objetos, la clasificación de texto o la clasificación de sonido.

import_samples

No

Boolean

Si importar muestras. Opciones:

  • true: Importar muestras. (Valor predeterminado)
  • false: no importar muestras.

import_type

No

String

Modo de importación. Opciones:

  • dir: Importar conjuntos de datos a través de una ruta OBS.
  • manifest: Importar conjuntos de datos a través de un archivo de manifiesto.

included_labels

No

Array of Label objects

Importar muestras que contengan la etiqueta especificada.

label_format

No

LabelFormat object

Formato de etiqueta. Este parámetro se utiliza únicamente para conjuntos de datos de texto.

with_column_header

No

Boolean

Si la primera fila del archivo es un nombre de columna. Este campo es válido para el conjunto de datos de la tabla. Opciones:

  • true: La primera fila del archivo es el nombre de la columna.
  • false: La primera fila del archivo no es el nombre de la columna. (Valor predeterminado)
Tabla 3 DataSource

Parámetro

Obligatorio

Tipo

Descripción

data_path

No

String

Ruta de origen de datos.

data_type

No

Integer

Tipo de datos. Opciones:

  • 0: bucket OBS (valor predeterminado)
  • 1: GaussDB(DWS)
  • 2: DLI
  • 3: RDS
  • 4: MRS
  • 5: AI Gallery
  • 6: Servicio de inferencia

schema_maps

No

Array of SchemaMap objects

Información de asignación de esquemas correspondiente a los datos de la tabla.

source_info

No

SourceInfo object

Información necesaria para importar un origen de datos de tabla.

with_column_header

No

Boolean

Si la primera fila del archivo es un nombre de columna. Este campo es válido para el conjunto de datos de la tabla. Opciones:

  • true: La primera fila del archivo es el nombre de la columna.
  • false: La primera fila del archivo no es el nombre de la columna.
Tabla 4 SchemaMap

Parámetro

Obligatorio

Tipo

Descripción

dest_name

No

String

Nombre de la columna de destino.

src_name

No

String

Nombre de la columna de origen.

Tabla 5 SourceInfo

Parámetro

Obligatorio

Tipo

Descripción

cluster_id

No

String

ID de un clúster MRS.

cluster_mode

No

String

Modo de ejecución de un clúster MRS. Opciones:

  • 0: clúster normal
  • 1: clúster de seguridad

cluster_name

No

String

Nombre de un clúster MRS.

database_name

No

String

Nombre de la base de datos a la que se importa el conjunto de datos de la tabla.

input

No

String

Ruta HDFS de un conjunto de datos de tabla.

ip

No

String

Dirección IP del clúster de GaussDB(DWS).

port

No

String

Número de puerto del clúster GaussDB(DWS).

queue_name

No

String

Nombre de la cola DLI de un conjunto de datos de tabla.

subnet_id

No

String

ID de subred de un clúster MRS.

table_name

No

String

Nombre de la tabla a la que se importa un conjunto de datos de tabla.

user_name

No

String

Nombre de usuario, que es obligatorio para los datos de GaussDB(DWS).

user_password

No

String

Contraseña de usuario, que es obligatoria para los datos de GaussDB(DWS).

vpc_id

No

String

ID de la VPC donde reside un clúster MRS.

Tabla 6 Label

Parámetro

Obligatorio

Tipo

Descripción

attributes

No

Array of LabelAttribute objects

Atributo multidimensional de una etiqueta. Por ejemplo, si la etiqueta es música, se pueden incluir atributos como el estilo y el artista.

name

No

String

Nombre de la etiqueta.

property

No

LabelProperty object

Par clave-valor de atributo básico de una etiqueta, como el color y las teclas de método abreviado.

type

No

Integer

Tipo de etiqueta. Opciones:

  • 0: clasificación de imágenes
  • 1: detección de objetos
  • 3: segmentación de la imagen
  • 100: Clasificación del texto
  • 101: reconocimiento de entidad nombrada
  • 102: Relación de trillizos de texto
  • 103: Entidad triplete de texto
  • 200: clasificación de sonido
  • 201: Etiquetado de voz
  • 202: Etiquetado de párrafo de discurso
  • 600: etiquetado de vídeo
Tabla 7 LabelAttribute

Parámetro

Obligatorio

Tipo

Descripción

default_value

No

String

Valor predeterminado de un atributo de etiqueta.

id

No

String

ID de atributo de etiqueta.

name

No

String

Nombre del atributo de etiqueta.

type

No

String

Tipo de atributo de etiqueta. Opciones:

  • text: texto
  • select: lista desplegable de una sola opción

values

No

Array of LabelAttributeValue objects

Lista de valores de atributo de etiqueta.

Tabla 8 LabelAttributeValue

Parámetro

Obligatorio

Tipo

Descripción

id

No

String

ID de valor de atributo de etiqueta.

value

No

String

Valor del atributo de etiqueta.

Tabla 9 LabelProperty

Parámetro

Obligatorio

Tipo

Descripción

@modelarts:color

No

String

Atributo predeterminado: Color de etiqueta, que es un código hexadecimal del color. De forma predeterminada, este parámetro se deja en blanco. Ejemplo: #FFFFF0.

@modelarts:default_shape

No

String

Atributo predeterminado: forma predeterminada de una etiqueta de detección de objeto (atributo dedicado). De forma predeterminada, este parámetro se deja en blanco. Opciones:

  • bndbox: rectángulo
  • polygon: polígono
  • circle: círculo
  • line: línea recta
  • dashed: línea de puntos
  • point: punto
  • polyline: polilínea

@modelarts:from_type

No

String

Atributo por defecto: Tipo de la entidad de cabecera en la etiqueta de relación de triplete. Este atributo debe especificarse cuando se crea una etiqueta de relación. Este parámetro solo se utiliza para el conjunto de datos de texto triplete.

@modelarts:rename_to

No

String

Atributo predeterminado: el nuevo nombre de la etiqueta.

@modelarts:shortcut

No

String

Atributo predeterminado: Tecla de método abreviado de etiqueta. De forma predeterminada, este parámetro se deja en blanco. Por ejemplo: D.

@modelarts:to_type

No

String

Atributo por defecto: Tipo de la entidad de cola en la etiqueta de relación de triplete. Este atributo debe especificarse cuando se crea una etiqueta de relación. Este parámetro solo se utiliza para el conjunto de datos de texto triplete.

Tabla 10 LabelFormat

Parámetro

Obligatorio

Tipo

Descripción

label_type

No

String

Tipo de etiqueta de clasificación de texto. Opciones:- 0: La etiqueta está separada del texto, y se distinguen por el sufijo fijo _result. Por ejemplo, el archivo de texto es abc.txt y el archivo de etiqueta es abc_result.txt.- 1: Valor predeterminado. Las etiquetas y los textos se almacenan en el mismo archivo y se separan por separadores. Puede utilizar text_sample_separator para especificar el separador entre el texto y la etiqueta y text_label_separator para especificar el separador entre etiquetas.

text_label_separator

No

String

Separador entre etiquetas. Por defecto, se utiliza un (,) de comas como separador. El separador necesita escaparse. El separador puede contener solo un carácter, como una letra, un dígito o cualquiera de los siguientes characters:!@#$%^&*_=|?/':.;,

text_sample_separator

No

String

Separador entre el texto y la etiqueta. Por defecto, la tecla Tab se utiliza como separador. El separador necesita escaparse. El separador puede contener solo un carácter, como una letra, un dígito o cualquiera de los siguientes characters:!@#$%^&*_=|?/':.;,

Parámetros de respuesta

Código de estado: 200

Tabla 11 Parámetros de body de respuesta

Parámetro

Tipo

Descripción

task_id

String

ID de una tarea de importación.

Solicitudes de ejemplo

  • Creación de una tarea de importación (importación de datos desde OBS)
    {
      "import_type" : "dir",
      "import_path" : "s3://test-obs/daoLu_images/cat-dog/",
      "included_labels" : [ ],
      "import_annotations" : false,
      "difficult_only" : false
    }
  • Creating an Import Task (Importing Data from Manifest)
    {
      "import_type" : "manifest",
      "import_path" : "s3://test-obs/classify/output/dataset-f9e8-gfghHSokody6AJigS5A/annotation/V002/V002.manifest",
      "included_labels" : [ "cat", "dog", "Cat", "Dog" ],
      "import_annotations" : true,
      "difficult_only" : false
    }

Ejemplo de respuestas

Código de estado: 200

OK

{
  "task_id" : "gfghHSokody6AJigS5A_m1dYqOw8vWCAznw1V28"
}

Códigos de estado

Código de estado

Descripción

200

OK

401

Unauthorized

403

Forbidden

404

Not Found

Códigos de error

Consulte Códigos de error.