Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Centro de ayuda> ModelArts> Referencia de la API> Gestión de datos> Tarea de exportación de datos> Creación de una Tarea de Exportación de Conjunto de Datos
Actualización más reciente 2022-11-14 GMT+08:00

Creación de una Tarea de Exportación de Conjunto de Datos

Función

Esta API se utiliza para crear una tarea de exportación de conjunto de datos para exportar un conjunto de datos a OBS o a nuevos conjuntos de datos.

URI

POST /v2/{project_id}/datasets/{dataset_id}/export-tasks

Tabla 1 Parámetros de ruta

Parámetro

Obligatorio

Tipo

Descripción

dataset_id

String

ID de conjunto de datos.

project_id

String

ID del proyecto. Para obtener más información sobre cómo obtener el ID de proyecto, consulte Obtención de un ID de proyecto.

Parámetros de solicitud

Tabla 2 Parámetros de body de solicitud

Parámetro

Obligatorio

Tipo

Descripción

version_id

No

String

ID de versión de conjunto de datos, que debe especificarse cuando se exportan datos de una versión de conjunto de datos.

path

No

String

Ruta de salida para exportar datos a OBS. Este parámetro es obligatorio cuando se exportan datos a OBS o a un nuevo conjunto de datos.

export_params

No

ExportParams object

Parámetros de una tarea de exportación de conjunto de datos.

annotation_format

No

String

Formato de etiquetado. Opciones:

  • VOC: VOC
  • COCO: COCO

export_format

No

Integer

Formato del directorio exportado. Opciones:

  • 1: estructura de árbol. Por ejemplo: cat/1.jpg,dog/2.jpg.
  • 2: estructura de mosaico. Por ejemplo: 1.jpg, 1.txt; 2.jpg,2.txt.

export_type

No

Integer

Tipo de exportación. Opciones:

  • 0: etiquetado
  • 1: sin etiquetar
  • 2: todos
  • 3: búsqueda condicional

sample_state

No

String

Estado de la muestra. Opciones:

  • __ALL__: etiquetado
  • __NONE__: sin etiqueta
  • __UNCHECK__: a comprobar
  • __ACEPTADO__: aceptado
  • __RECHAZADO__: rechazado
  • __UNREVIEWED__: a ser revisado
  • __REVISADO__: revisado
  • __WORKFORCE_SAMPLED__: datos revisados muestreados
  • __WORKFORCE_SAMPLED_UNCHECK__: muestras a comprobar
  • __WORKFORCE_SAMPLED_CHECKED__: muestras comprobadas
  • __WORKFORCE_SAMPLED_ACCEPTED__: muestras aceptadas
  • __WORKFORCE_SAMPLED_REJECTED__: muestras rechazadas
  • __AUTO_ANNOTATION__: a comprobar

source_type_header

No

String

Prefijo de la ruta de acceso OBS en el archivo de etiquetado exportado. El valor predeterminado es obs://. Puede configurarlo en s3://. La ruta de la imagen que comienza con obs no se puede analizar durante el entrenamiento. Establezca el prefijo de ruta en el archivo de manifest exportado en s3://.

status

No

Integer

Estado de la tarea.

task_id

No

String

ID de tarea.

version_format

No

String

Formato de una versión de conjunto de datos. Opciones:

  • Default: formato predeterminado
  • CarbonData (soportado solo por conjuntos de datos de tablas)
  • CSV: CSV

with_column_header

No

Boolean

Si se debe escribir el nombre de columna en la primera línea del archivo CSV durante la exportación. Este campo es válido para el conjunto de datos de la tabla. Opciones:

  • true: Escriba el nombre de la columna en la primera línea del archivo CSV. (Valor predeterminado)
  • false: No escriba el nombre de la columna en la primera línea del archivo CSV.
Tabla 3 ExportParams

Parámetro

Obligatorio

Tipo

Descripción

clear_hard_property

No

Boolean

Si se deben borrar los atributos de ejemplo duro. Opciones:

  • true: Borre atributos de ejemplo duro. (Valor predeterminado)
  • false: no borre los atributos de ejemplo duro.

export_dataset_version_format

No

String

Formato de la versión del conjunto de datos a la que se exportan los datos.

export_dataset_version_name

No

String

Nombre de la versión del conjunto de datos a la que se exportan los datos.

export_dest

No

String

Destino de exportación. Opciones:

  • DIR: Exportar datos a OBS. (Valor predeterminado)
  • NEW_DATASET: Exportar datos a un nuevo conjunto de datos.

export_new_dataset_name

No

String

Nombre del nuevo conjunto de datos al que se exportan los datos.

export_new_dataset_work_path

No

String

Directorio de trabajo del nuevo conjunto de datos al que se exportan los datos.

ratio_sample_usage

No

Boolean

Si se asigna aleatoriamente el conjunto de entrenamiento y el conjunto de validación en función de la relación especificada. Opciones:

  • true: Asigne el conjunto de entrenamiento y el conjunto de validación.
  • false: no asigne el conjunto de entrenamiento y el conjunto de validación. (Valor predeterminado)

sample_state

No

String

Estado de la muestra. Opciones:

  • __ALL__: etiquetado
  • __NONE__: sin etiqueta
  • __UNCHECK__: a comprobar
  • __ACEPTADO__: aceptado
  • __RECHAZADO__: rechazado
  • __UNREVIEWED__: a ser revisado
  • __REVISADO__: revisado
  • __WORKFORCE_SAMPLED__: datos revisados muestreados
  • __WORKFORCE_SAMPLED_UNCHECK__: muestras a comprobar
  • __WORKFORCE_SAMPLED_CHECKED__: muestras comprobadas
  • __WORKFORCE_SAMPLED_ACCEPTED__: muestras aceptadas
  • __WORKFORCE_SAMPLED_REJECTED__: muestras rechazadas
  • __AUTO_ANNOTATION__: a comprobar

samples

No

Array of strings

Lista de ID de muestras exportadas.

search_conditions

No

Array of SearchCondition objects

Condiciones de búsqueda exportadas. La relación entre múltiples condiciones de búsqueda es O.

train_sample_ratio

No

String

Relación de división entre el conjunto de entrenamiento y el conjunto de verificación durante la liberación de la versión especificada. El valor predeterminado es 1.00, lo que indica que todas las versiones publicadas son conjuntos de entrenamiento.

Tabla 4 SearchCondition

Parámetro

Obligatorio

Tipo

Descripción

coefficient

No

String

Filtrar por coeficiente de dificultad.

frame_in_video

No

Integer

Un cuadro en el vídeo.

hard

No

String

Si una muestra es una muestra dura. Opciones:

  • 0: muestra no dura
  • 1: muestra dura

import_origin

No

String

Filtrar por origen de datos.

kvp

No

String

Dosificación de CT, filtrada por dosificación.

label_list

No

SearchLabels object

Criterios de búsqueda de etiquetas.

labeler

No

String

Etiquetadora.

metadata

No

SearchProp object

Búsqueda por atributo de muestra.

parent_sample_id

No

String

ID de la muestra de los padres.

sample_dir

No

String

Directorio donde se almacenan muestras de datos (el directorio debe terminar con una barra diagonal (/)). Solo se buscan ejemplos en el directorio especificado. No se admite la búsqueda recursiva de directorios.

sample_name

No

String

Buscar por nombre de ejemplo, incluida la extensión del nombre de archivo.

sample_time

No

String

Cuando se agrega una muestra al conjunto de datos, se crea un índice basado en la última hora de modificación (exacta al día) de la muestra en OBS. Puede buscar la muestra en función de la hora. Opciones:- month: Búsqueda de muestras agregadas desde hace 30 días al día actual.- day: Búsqueda de muestras agregadas desde ayer (hace un día) al día actual.- yyyyMMdd-yyyyMMdd: Búsqueda de muestras agregadas en un período especificado (como máximo 30 días), en el formato de Start date-End date. Por ejemplo, 20190901-2019091501 indica que se buscan muestras generadas del 1 de septiembre al 15 de septiembre de 2019.

score

No

String

Búsqueda por confianza.

slice_thickness

No

String

Espesor de capa DICOM. Las muestras se filtran por el espesor de la capa.

study_date

No

String

Tiempo de escaneo DICOM.

time_in_video

No

String

Un punto de tiempo en el video.

Tabla 5 SearchLabels

Parámetro

Obligatorio

Tipo

Descripción

labels

No

Array of SearchLabel objects

Lista de criterios de búsqueda de etiquetas.

op

No

String

Si desea buscar varias etiquetas, debe especificarse op. Si busca solo una etiqueta, op puede dejarse en blanco. Opciones:

  • OR: OR operation
  • AND: operación Y
Tabla 6 SearchLabel

Parámetro

Obligatorio

Tipo

Descripción

name

No

String

Nombre de la etiqueta.

op

No

String

Tipo de operación entre múltiples atributos. Opciones:

  • OR: operación O
  • AND: operación Y

property

No

Map<String,Array<String>>

El atributo de etiqueta que tiene el formato Object y almacena todos los pares clave-valor. key indica el nombre del atributo y value indica la lista de valores. Si value es null, la búsqueda no se realiza por valor. De lo contrario, el valor de búsqueda puede ser cualquier valor de la lista.

type

No

Integer

Tipo de etiqueta. Opciones:

  • 0: clasificación de imágenes
  • 1: detección de objetos
  • 3: segmentación de la imagen
  • 100: Clasificación del texto
  • 101: reconocimiento de entidad nombrada
  • 102: Relación de trillizos de texto
  • 103: Entidad triplete de texto
  • 200: clasificación de sonido
  • 201: Etiquetado de voz
  • 202: Etiquetado de párrafo de discurso
  • 600: etiquetado de vídeo
Tabla 7 SearchProp

Parámetro

Obligatorio

Tipo

Descripción

op

No

String

Relación entre valores de atributo. Opciones:

  • AND: relación Y
  • OR: Relación O

props

No

Map<String,Array<String>>

Criterios de búsqueda de un atributo. Se pueden establecer varios criterios de búsqueda.

Parámetros de respuesta

Código de estado: 200

Tabla 8 Parámetros de body de respuesta

Parámetro

Tipo

Descripción

create_time

Long

Hora en la que se crea una tarea.

error_code

String

Código de error.

error_msg

String

Mensaje de error.

export_format

Integer

Formato del directorio exportado. Opciones:

  • 1: estructura de árbol. Por ejemplo: cat/1.jpg,dog/2.jpg.
  • 2: estructura de mosaico. Por ejemplo: 1.jpg, 1.txt; 2.jpg,2.txt.

export_params

ExportParams object

Parámetros de una tarea de exportación de conjunto de datos.

export_type

Integer

Tipo de exportación. Opciones:

  • 0: etiquetado
  • 1: sin etiquetar
  • 2: todos
  • 3: búsqueda condicional

finished_sample_count

Integer

Número de muestras completadas.

path

String

Exportar ruta de salida.

progress

Float

Porcentaje del progreso de la tarea actual.

status

String

Estado de la tarea. Opciones:

  • INIT: inicializado
  • RUNNING: en ejecución
  • FAILED: falló
  • SUCCESSED: completado

task_id

String

ID de tarea.

total_sample_count

Integer

Número total de muestras.

update_time

Long

Hora en la que se actualiza una tarea.

version_format

String

Formato de una versión de conjunto de datos. Opciones:

  • Default: formato predeterminado
  • CarbonData (soportado solo por conjuntos de datos de tablas)
  • CSV: CSV

version_id

String

ID de versión del conjunto de datos.

Tabla 9 ExportParams

Parámetro

Tipo

Descripción

clear_hard_property

Boolean

Si se deben borrar los atributos de ejemplo duro. Opciones:

  • true: Borre atributos de ejemplo duro. (Valor predeterminado)
  • false: no borre los atributos de ejemplo duro.

export_dataset_version_format

String

Formato de la versión del conjunto de datos a la que se exportan los datos.

export_dataset_version_name

String

Nombre de la versión del conjunto de datos a la que se exportan los datos.

export_dest

String

Destino de exportación. Opciones:

  • DIR: Exportar datos a OBS. (Valor predeterminado)
  • NEW_DATASET: Exportar datos a un nuevo conjunto de datos.

export_new_dataset_name

String

Nombre del nuevo conjunto de datos al que se exportan los datos.

export_new_dataset_work_path

String

Directorio de trabajo del nuevo conjunto de datos al que se exportan los datos.

ratio_sample_usage

Boolean

Si se asigna aleatoriamente el conjunto de entrenamiento y el conjunto de validación en función de la relación especificada. Opciones:

  • true: Asigne el conjunto de entrenamiento y el conjunto de validación.
  • false: no asigne el conjunto de entrenamiento y el conjunto de validación. (Valor predeterminado)

sample_state

String

Estado de la muestra. Opciones:

  • __ALL__: etiquetado
  • __NONE__: sin etiqueta
  • __UNCHECK__: a comprobar
  • __ACEPTADO__: aceptado
  • __RECHAZADO__: rechazado
  • __UNREVIEWED__: a ser revisado
  • __REVISADO__: revisado
  • __WORKFORCE_SAMPLED__: datos revisados muestreados
  • __WORKFORCE_SAMPLED_UNCHECK__: muestras a comprobar
  • __WORKFORCE_SAMPLED_CHECKED__: muestras comprobadas
  • __WORKFORCE_SAMPLED_ACCEPTED__: muestras aceptadas
  • __WORKFORCE_SAMPLED_REJECTED__: muestras rechazadas
  • __AUTO_ANNOTATION__: a comprobar

samples

Array of strings

Lista de ID de muestras exportadas.

search_conditions

Array of SearchCondition objects

Condiciones de búsqueda exportadas. La relación entre múltiples condiciones de búsqueda es O.

train_sample_ratio

String

Relación de división entre el conjunto de entrenamiento y el conjunto de verificación durante la liberación de la versión especificada. El valor predeterminado es 1.00, lo que indica que todas las versiones publicadas son conjuntos de entrenamiento.

Tabla 10 SearchCondition

Parámetro

Tipo

Descripción

coefficient

String

Filtrar por coeficiente de dificultad.

frame_in_video

Integer

Un cuadro en el vídeo.

hard

String

Si una muestra es una muestra dura. Opciones:

  • 0: muestra no dura
  • 1: muestra dura

import_origin

String

Filtrar por origen de datos.

kvp

String

Dosificación de CT, filtrada por dosificación.

label_list

SearchLabels object

Criterios de búsqueda de etiquetas.

labeler

String

Etiquetadora.

metadata

SearchProp object

Búsqueda por atributo de muestra.

parent_sample_id

String

ID de la muestra de los padres.

sample_dir

String

Directorio donde se almacenan muestras de datos (el directorio debe terminar con una barra diagonal (/)). Solo se buscan ejemplos en el directorio especificado. No se admite la búsqueda recursiva de directorios.

sample_name

String

Buscar por nombre de ejemplo, incluida la extensión del nombre de archivo.

sample_time

String

Cuando se agrega una muestra al conjunto de datos, se crea un índice basado en la última hora de modificación (exacta al día) de la muestra en OBS. Puede buscar la muestra en función de la hora. Opciones:- month: Búsqueda de muestras agregadas desde hace 30 días al día actual.- day: Búsqueda de muestras agregadas desde ayer (hace un día) al día actual.- yyyyMMdd-yyyyMMdd: Búsqueda de muestras agregadas en un período especificado (como máximo 30 días), en el formato de Start date-End date. Por ejemplo, 20190901-2019091501 indica que se buscan muestras generadas del 1 de septiembre al 15 de septiembre de 2019.

score

String

Búsqueda por confianza.

slice_thickness

String

Espesor de capa DICOM. Las muestras se filtran por el espesor de la capa.

study_date

String

Tiempo de escaneo DICOM.

time_in_video

String

Un punto de tiempo en el video.

Tabla 11 SearchLabels

Parámetro

Tipo

Descripción

labels

Array of SearchLabel objects

Lista de criterios de búsqueda de etiquetas.

op

String

Si desea buscar varias etiquetas, debe especificarse op. Si busca solo una etiqueta, op puede dejarse en blanco. Opciones:

  • OR: operación O
  • AND: operación Y
Tabla 12 SearchLabel

Parámetro

Tipo

Descripción

name

String

Nombre de la etiqueta.

op

String

Tipo de operación entre múltiples atributos. Opciones:

  • OR: operación O
  • AND: operación Y

property

Map<String,Array<String>>

El atributo de etiqueta que tiene el formato Object y almacena todos los pares clave-valor. key indica el nombre del atributo y value indica la lista de valores. Si value es null, la búsqueda no se realiza por valor. De lo contrario, el valor de búsqueda puede ser cualquier valor de la lista.

type

Integer

Tipo de etiqueta. Opciones:

  • 0: clasificación de imágenes
  • 1: detección de objetos
  • 3: segmentación de la imagen
  • 100: Clasificación del texto
  • 101: reconocimiento de entidad nombrada
  • 102: Relación de trillizos de texto
  • 103: Entidad triplete de texto
  • 200: clasificación de sonido
  • 201: Etiquetado de voz
  • 202: Etiquetado de párrafo de discurso
  • 600: etiquetado de vídeo
Tabla 13 SearchProp

Parámetro

Tipo

Descripción

op

String

Relación entre valores de atributo. Opciones:

  • AND: relación Y
  • OR: Relación O

props

Map<String,Array<String>>

Criterios de búsqueda de un atributo. Se pueden establecer varios criterios de búsqueda.

Solicitudes de ejemplo

  • Creación de una tarea de exportación (exportación de datos a OBS)
    {
      "path" : "/test-obs/daoChu/",
      "export_type" : 3,
      "export_params" : {
        "sample_state" : "",
        "export_dest" : "DIR"
      }
    }
  • Creación de una tarea de exportación (exportación de datos a un nuevo conjunto de datos)
    {
      "path" : "/test-obs/classify/input/",
      "export_type" : 3,
      "export_params" : {
        "sample_state" : "",
        "export_dest" : "NEW_DATASET",
        "export_new_dataset_name" : "dataset-export-test",
        "export_new_dataset_work_path" : "/test-obs/classify/output/"
      }
    }

Ejemplo de respuestas

Código de estado: 200

OK

{
  "task_id" : "rF9NNoB56k5rtYKg2Y7"
}

Códigos de estado

Código de estado

Descripción

200

OK

401

Unauthorized

403

Forbidden

404

Not Found

Códigos de error

Consulte Códigos de error.