Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Actualización más reciente 2022-11-14 GMT+08:00

Adición de muestras en lotes

Función

Esta API se utiliza para agregar muestras en lotes.

URI

POST /v2/{project_id}/datasets/{dataset_id}/data-annotations/samples

Tabla 1 Parámetros de ruta

Parámetro

Obligatorio

Tipo

Descripción

dataset_id

String

ID de conjunto de datos.

project_id

String

ID del proyecto. Para obtener más información sobre cómo obtener el ID de proyecto, consulte Obtención de un ID de proyecto.

Parámetros de solicitud

Tabla 2 Parámetros de body de solicitud

Parámetro

Obligatorio

Tipo

Descripción

final_annotation

No

Boolean

Si importar directamente al resultado final. Opciones:

  • true: Importar etiquetas al conjunto de datos etiquetado. (valor predeterminado).
  • false: Importar etiquetas al conjunto de datos que se va a confirmar. Actualmente, los conjuntos de datos por confirmar solo admiten categorías de clasificación de imágenes y detección de objetos.

label_format

No

LabelFormat object

Formato de etiqueta. Este parámetro se utiliza únicamente para conjuntos de datos de texto.

samples

No

Array of Sample objects

Lista de muestra.

Tabla 3 LabelFormat

Parámetro

Obligatorio

Tipo

Descripción

label_type

No

String

Tipo de etiqueta de clasificación de texto. Opciones:- 0: La etiqueta está separada del texto, y se distinguen por el sufijo fijo _result. Por ejemplo, el archivo de texto es abc.txt y el archivo de etiqueta es abc_result.txt.- 1: Valor predeterminado. Las etiquetas y los textos se almacenan en el mismo archivo y se separan por separadores. Puede utilizar text_sample_separator para especificar el separador entre el texto y la etiqueta y text_label_separator para especificar el separador entre etiquetas.

text_label_separator

No

String

Separador entre etiquetas. Por defecto, se utiliza un (,) de comas como separador. El separador necesita escaparse. El separador puede contener solo un carácter, como una letra, un dígito o cualquiera de los siguientes characters:!@#$%^&*_=|?/':.;,

text_sample_separator

No

String

Separador entre el texto y la etiqueta. Por defecto, la tecla Tab se utiliza como separador. El separador necesita escaparse. El separador puede contener solo un carácter, como una letra, un dígito o cualquiera de los siguientes characters:!@#$%^&*_=|?/':.;,

Tabla 4 Sample

Parámetro

Obligatorio

Tipo

Descripción

data

No

Object

Datos de bytes de archivos de ejemplo. El tipo es java.nio.ByteBuffer. Cuando se llama a este parámetro, se carga la cadena convertida a partir de los datos de byte.

data_source

No

DataSource object

Fuente de datos.

encoding

No

String

Tipo de codificación de archivos de ejemplo, que se utiliza para subir archivos .txt o .csv. El valor puede ser UTF-8, GBK, or GB2312. El valor predeterminado es UTF-8.

labels

No

Array of SampleLabel objects

Lista de etiquetas de muestra.

metadata

No

SampleMetadata object

Par clave-valor del atributo de muestra metadata.

name

No

String

Nombre de los archivos de ejemplo. El valor contiene caracteres de 0 a 1,024 y no puede contener caracteres especiales (!<>=&').

sample_type

No

Integer

Tipo de muestra. Opciones:

  • 0: imagen
  • 1: texto
  • 2: voz
  • 4: tabla
  • 6: vídeo
  • 9: formato personalizado
Tabla 5 DataSource

Parámetro

Obligatorio

Tipo

Descripción

data_path

No

String

Ruta de origen de datos.

data_type

No

Integer

Tipo de datos. Opciones:

  • 0: bucket OBS (valor predeterminado)
  • 1: GaussDB(DWS)
  • 2: DLI
  • 3: RDS
  • 4: MRS
  • 5: AI Gallery
  • 6: Servicio de inferencia

schema_maps

No

Array of SchemaMap objects

Información de asignación de esquemas correspondiente a los datos de la tabla.

source_info

No

SourceInfo object

Información necesaria para importar un origen de datos de tabla.

with_column_header

No

Boolean

Si la primera fila del archivo es un nombre de columna. Este campo es válido para el conjunto de datos de la tabla. Opciones:

  • true: La primera fila del archivo es el nombre de la columna.
  • false: La primera fila del archivo no es el nombre de la columna.
Tabla 6 SchemaMap

Parámetro

Obligatorio

Tipo

Descripción

dest_name

No

String

Nombre de la columna de destino.

src_name

No

String

Nombre de la columna de origen.

Tabla 7 SourceInfo

Parámetro

Obligatorio

Tipo

Descripción

cluster_id

No

String

ID de un clúster MRS.

cluster_mode

No

String

Modo de ejecución de un clúster MRS. Opciones:

  • 0: clúster normal
  • 1: clúster de seguridad

cluster_name

No

String

Nombre de un clúster MRS.

database_name

No

String

Nombre de la base de datos a la que se importa el conjunto de datos de la tabla.

input

No

String

Ruta HDFS de un conjunto de datos de tabla.

ip

No

String

Dirección IP del clúster de GaussDB(DWS).

port

No

String

Número de puerto del clúster GaussDB(DWS).

queue_name

No

String

Nombre de la cola DLI de un conjunto de datos de tabla.

subnet_id

No

String

ID de subred de un clúster MRS.

table_name

No

String

Nombre de la tabla a la que se importa un conjunto de datos de tabla.

user_name

No

String

Nombre de usuario, que es obligatorio para los datos de GaussDB(DWS).

user_password

No

String

Contraseña de usuario, que es obligatoria para los datos de GaussDB(DWS).

vpc_id

No

String

ID de la VPC donde reside un clúster MRS.

Tabla 8 SampleLabel

Parámetro

Obligatorio

Tipo

Descripción

annotated_by

No

String

Método de etiquetado de vídeo, que se utiliza para distinguir si un vídeo se etiqueta manualmente o automáticamente. Opciones:

  • human: etiquetado manual
  • auto: etiquetado automático

id

No

String

ID de la etiqueta.

name

No

String

Nombre de la etiqueta.

property

No

SampleLabelProperty object

Par de atributo clave-valor de la etiqueta de ejemplo, como la forma del objeto y características de forma.

score

No

Float

Confianza.

type

No

Integer

Tipo de etiqueta. Opciones:

  • 0: clasificación de imágenes
  • 1: detección de objetos
  • 3: segmentación de la imagen
  • 100: Clasificación del texto
  • 101: reconocimiento de entidad nombrada
  • 102: Relación de trillizos de texto
  • 103: Entidad triplete de texto
  • 200: clasificación de sonido
  • 201: Etiquetado de voz
  • 202: Etiquetado de párrafo de discurso
  • 600: etiquetado de vídeo
Tabla 9 SampleLabelProperty

Parámetro

Obligatorio

Tipo

Descripción

@modelarts:content

No

String

Contenido de texto de voz, que es un atributo predeterminado dedicado a la etiqueta de voz . (incluido el contenido del habla y los puntos de inicio y final del habla).

@modelarts:end_index

No

Integer

Posición final del texto, que es un atributo predeterminado dedicado a la etiqueta de entidad con nombre. La posición final no incluye el carácter correspondiente al valor de end_index. Los ejemplos son los siguientes.- Si el contenido del texto es "Barack Hussein Obama II (born August 4, 1961) is an American attorney and politician.", los valores start_index y end_index de "Barack Hussein Obama II" son 0 y 23, respectivamente.- Si el contenido del texto es "By the end of 2018, the company has more than 100 employees.", los valores start_index y end_index de "By the end of 2018" son 0 y 18, respectivamente.

@modelarts:end_time

No

String

Tiempo de finalización de voz, que es un atributo por defecto dedicado a la etiqueta de punto de inicio/fin de voz, en el formato de hh:mm:ss.SSS. (hh indica la hora; mm indica el minuto; ss indica el segundo; y SSS indica el milisegundo.)

@modelarts:feature

No

Object

Característica de forma, que es un atributo predeterminado dedicado a la etiqueta de detección de objetos, con tipo de List. La esquina superior izquierda de una imagen se utiliza como el origen de coordenadas [0,0]. Cada punto de coordenada está representado por [x, y]. x indica la coordenada horizontal e y indica la coordenada vertical . (tanto x como y son mayores o iguales a 0). El formato de cada forma es el siguiente: - bndbox: consta de dos puntos, por ejemplo, [[0,10],[50,95]]. El primer punto se encuentra en la esquina superior izquierda del rectángulo y el segundo punto se encuentra en la esquina inferior derecha del rectángulo. Es decir, la coordenada X del primer punto debe ser menor que la del segundo punto, y la coordenada Y del segundo punto debe ser menor que la del primer punto.- polygon: consiste en múltiples puntos que están conectados en secuencia para formar un polígono, por ejemplo, [[0,100],[50,95],[10,60],[500,400]].- circle: consiste en el punto central y el radio, por ejemplo, [[100,100],[50]].- line: consta de dos puntos, por ejemplo, [[0,100],[50,95]]. El primer punto es el punto de inicio, y el segundo punto es el punto final.- dashed: consta de dos puntos, por ejemplo, [[0,100],[50,95]]. El primer punto es el punto inicial, y el segundo punto es el punto final.- point: consiste en un punto, por ejemplo, [[0,100]].- polyline: consiste en múltiples puntos, por ejemplo, [[0,100],[50,95],[10,60],[500,400]].

@modelarts:from

No

String

ID de la entidad de cabeza en la etiqueta de relación de triplete, que es un atributo por defecto dedicado a la etiqueta de relación de triplete.

@modelarts:hard

No

String

Muestra etiquetada como muestra dura o no, que es un atributo predeterminado. Opciones:

  • 0/false: no es un ejemplo difícil
  • 1/true: ejemplo duro

@modelarts:hard_coefficient

No

String

Coeficiente de dificultad de cada nivel de etiqueta, que es un atributo predeterminado. El rango de valores es [0,1].

@modelarts:hard_reasons

No

String

Razones por las que la muestra es una muestra dura, que es un atributo predeterminado. Utilice un guion (-) para separar cada dos ID de motivos de muestra dura, por ejemplo, 3-20-21-19. Opciones:

  • 0: No se identifican objetos de destino.
  • 1: La confianza es baja.
  • 2: El resultado de agrupamiento basado en el conjunto de datos de entrenamiento es inconsistente con el resultado de predicción.
  • 3: El resultado de la predicción es muy diferente de los datos del mismo tipo en el conjunto de datos de entrenamiento.
  • 4: Los resultados de predicción de múltiples imágenes similares consecutivas son inconsistentes.
  • 5: Hay un gran desplazamiento entre la resolución de la imagen y la distribución de características del conjunto de datos de entrenamiento.
  • 6: Hay un gran desplazamiento entre la relación de aspecto de la imagen y la distribución de características del conjunto de datos de entrenamiento.
  • 7: Hay un gran desplazamiento entre el brillo de la imagen y la distribución de características del conjunto de datos de entrenamiento.
  • 8: Hay un gran desplazamiento entre la saturación de la imagen y la distribución de características del conjunto de datos de entrenamiento.
  • 9: Hay un gran desplazamiento entre la riqueza de color de la imagen y la distribución de características del conjunto de datos de entrenamiento.
  • 10: Hay un gran desplazamiento entre la definición de la imagen y la distribución de características del conjunto de datos de entrenamiento.
  • 11: Hay un gran desplazamiento entre el número de fotogramas de la imagen y la distribución de características del conjunto de datos de entrenamiento.
  • 12: Hay un gran desplazamiento entre la desviación estándar del área de los fotogramas de imagen y la distribución de características del conjunto de datos de entrenamiento.
  • 13: Hay un gran desplazamiento entre la relación de aspecto de los fotogramas de imagen y la distribución de características del conjunto de datos de entrenamiento.
  • 14: Hay un gran desplazamiento entre la parte de área de los fotogramas de imagen y la distribución de características del conjunto de datos de entrenamiento.
  • 15: Hay un gran desplazamiento entre el borde de los fotogramas de imagen y la distribución de características del conjunto de datos de entrenamiento.
  • 16: Hay un gran desplazamiento entre el brillo de los fotogramas de imagen y la distribución de características del conjunto de datos de entrenamiento.
  • 17: Hay un gran desplazamiento entre la definición de fotogramas de imagen y la distribución de características del conjunto de datos de entrenamiento.
  • 18: Hay un gran desplazamiento entre la pila de cuadros de imagen y la distribución de características del conjunto de datos de entrenamiento.
  • 19: El resultado de mejora de datos basado en el GaussianBlur es inconsistente con el resultado de predicción de la imagen original.
  • 20: El resultado de mejora de datos basado en fliplr es inconsistente con el resultado de predicción de la imagen original.
  • 21: El resultado de mejora de datos basado en Recortar es inconsistente con el resultado de predicción de la imagen original.
  • 22: El resultado de mejora de datos basado en flipud es inconsistente con el resultado de predicción de la imagen original.
  • 23: El resultado de mejora de datos basado en la escala es inconsistente con el resultado de predicción de la imagen original.
  • 24: El resultado de mejora de datos basado en la traducción es inconsistente con el resultado de predicción de la imagen original.
  • 25: El resultado de mejora de datos basado en el cizallamiento es inconsistente con el resultado de predicción de la imagen original.
  • 26: El resultado de mejora de datos basado en superpíxeles es inconsistente con el resultado de predicción de la imagen original.
  • 27: El resultado de mejora de datos basado en la nitidez es inconsistente con el resultado de predicción de la imagen original.
  • 28: El resultado de mejora de datos basado en la adición es inconsistente con el resultado de predicción de la imagen original.
  • 29: El resultado de mejora de datos basado en la inversión es inconsistente con el resultado de predicción de la imagen original.
  • 30: Se predice que los datos son anormales.

@modelarts:shape

No

String

Forma de objeto, que es un atributo predeterminado dedicado a la etiqueta de detección de objetos y se deja vacía de forma predeterminada. Opciones:

  • bndbox: rectángulo
  • polygon: polígono
  • circle: círculo
  • line: línea recta
  • dashed: línea de puntos
  • point: punto
  • polyline: polilínea

@modelarts:source

No

String

Fuente de voz, que es un atributo por defecto dedicado a la etiqueta de punto de inicio/fin de voz y que puede ajustarse a un altavoz o narrador.

@modelarts:start_index

No

Integer

Posición inicial del texto, que es un atributo predeterminado dedicado a la etiqueta de entidad con nombre. El valor inicial comienza desde 0, incluyendo el carácter correspondiente al valor de start_index.

@modelarts:start_time

No

String

Tiempo de inicio de voz, que es un atributo por defecto dedicado a la etiqueta de punto de inicio/fin de voz, en el formato de hh:mm:ss.SSS. (hh indica la hora; mm indica el minuto; ss indica el segundo; y SSS indica el milisegundo.)

@modelarts:to

No

String

ID de la entidad de cola en la etiqueta de relación de triplete, que es un atributo por defecto dedicado a la etiqueta de relación de triplete.

Tabla 10 SampleMetadata

Parámetro

Obligatorio

Tipo

Descripción

@modelarts:import_origin

No

Integer

Fuente de ejemplo, que es un atributo integrado.

@modelarts:hard

No

Double

Si la muestra está etiquetada como muestra dura, que es un atributo predeterminado. Opciones:

  • 0: muestra no dura
  • 1: muestra dura

@modelarts:hard_coefficient

No

Double

Coeficiente de dificultad de cada nivel de muestra, que es un atributo predeterminado. El rango de valores es [0,1].

@modelarts:hard_reasons

No

Array of integers

ID de una razón de ejemplo difícil, que es un atributo predeterminado. Opciones:

  • 0: No se identifican objetos de destino.
  • 1: La confianza es baja.
  • 2: El resultado de agrupamiento basado en el conjunto de datos de entrenamiento es inconsistente con el resultado de predicción.
  • 3: El resultado de la predicción es muy diferente de los datos del mismo tipo en el conjunto de datos de entrenamiento.
  • 4: Los resultados de predicción de múltiples imágenes similares consecutivas son inconsistentes.
  • 5: Hay un gran desplazamiento entre la resolución de la imagen y la distribución de características del conjunto de datos de entrenamiento.
  • 6: Hay un gran desplazamiento entre la relación de aspecto de la imagen y la distribución de características del conjunto de datos de entrenamiento.
  • 7: Hay un gran desplazamiento entre el brillo de la imagen y la distribución de características del conjunto de datos de entrenamiento.
  • 8: Hay un gran desplazamiento entre la saturación de la imagen y la distribución de características del conjunto de datos de entrenamiento.
  • 9: Hay un gran desplazamiento entre la riqueza de color de la imagen y la distribución de características del conjunto de datos de entrenamiento.
  • 10: Hay un gran desplazamiento entre la definición de la imagen y la distribución de características del conjunto de datos de entrenamiento.
  • 11: Hay un gran desplazamiento entre el número de fotogramas de la imagen y la distribución de características del conjunto de datos de entrenamiento.
  • 12: Hay un gran desplazamiento entre la desviación estándar del área de los fotogramas de imagen y la distribución de características del conjunto de datos de entrenamiento.
  • 13: Hay un gran desplazamiento entre la relación de aspecto de los fotogramas de imagen y la distribución de características del conjunto de datos de entrenamiento.
  • 14: Hay un gran desplazamiento entre la parte de área de los fotogramas de imagen y la distribución de características del conjunto de datos de entrenamiento.
  • 15: Hay un gran desplazamiento entre el borde de los fotogramas de imagen y la distribución de características del conjunto de datos de entrenamiento.
  • 16: Hay un gran desplazamiento entre el brillo de los fotogramas de imagen y la distribución de características del conjunto de datos de entrenamiento.
  • 17: Hay un gran desplazamiento entre la definición de fotogramas de imagen y la distribución de características del conjunto de datos de entrenamiento.
  • 18: Hay un gran desplazamiento entre la pila de cuadros de imagen y la distribución de características del conjunto de datos de entrenamiento.
  • 19: El resultado de mejora de datos basado en el GaussianBlur es inconsistente con el resultado de predicción de la imagen original.
  • 20: El resultado de mejora de datos basado en fliplr es inconsistente con el resultado de predicción de la imagen original.
  • 21: El resultado de mejora de datos basado en Recortar es inconsistente con el resultado de predicción de la imagen original.
  • 22: El resultado de mejora de datos basado en flipud es inconsistente con el resultado de predicción de la imagen original.
  • 23: El resultado de mejora de datos basado en la escala es inconsistente con el resultado de predicción de la imagen original.
  • 24: El resultado de mejora de datos basado en la traducción es inconsistente con el resultado de predicción de la imagen original.
  • 25: El resultado de mejora de datos basado en el cizallamiento es inconsistente con el resultado de predicción de la imagen original.
  • 26: El resultado de mejora de datos basado en superpíxeles es inconsistente con el resultado de predicción de la imagen original.
  • 27: El resultado de mejora de datos basado en la nitidez es inconsistente con el resultado de predicción de la imagen original.
  • 28: El resultado de mejora de datos basado en la adición es inconsistente con el resultado de predicción de la imagen original.
  • 29: El resultado de mejora de datos basado en la inversión es inconsistente con el resultado de predicción de la imagen original.
  • 30: Se predice que los datos son anormales.

@modelarts:size

No

Array of objects

Tamaño de la imagen (ancho, alto y profundidad de la imagen), que es un atributo predeterminado, con tipo de List. En la lista, el primer número indica la anchura (píxeles), el segundo número indica la altura (píxeles) y el tercer número indica la profundidad . (la profundidad puede dejarse en blanco y el valor predeterminado es 3). Por ejemplo, [100,200,3] y [100,200] son válidos. Nota: Este parámetro sólo es obligatorio cuando la lista de etiquetas de ejemplo contiene la etiqueta de detección de objetos.

Parámetros de respuesta

Código de estado: 200

Tabla 11 Parámetros de body de respuesta

Parámetro

Tipo

Descripción

error_code

String

Código de error.

error_msg

String

Mensaje de error.

results

Array of UploadSampleResp objects

Lista de respuestas para agregar muestras en lotes.

success

Boolean

Si la operación es exitosa. Opciones:

  • true: exitoso
  • false: fallido
Tabla 12 UploadSampleResp

Parámetro

Tipo

Descripción

error_code

String

Código de error.

error_msg

String

Mensaje de error.

info

String

Descripción.

name

String

Nombre de un archivo de ejemplo.

success

Boolean

Si la operación es exitosa. Opciones:

  • true: exitoso
  • false: fallido

Solicitudes de ejemplo

Adición de muestras en lotes

{
  "samples" : [ {
    "name" : "2.jpg",
    "data" : "/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAgGBgcGBQgHBwcJCQgKDBQNDAsLDBkSEw8UHRofHh0aHBwgJC4nICIsIxwcKDcpLDAxNDQ0Hyc5PTgyPC4zNDL/2wBDAQkJCQwLDBgNDRgyIRwhMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjL/wAARCAA1AJUDASIAAhEBAxEB/8QAHwAAAQUBAQEBAQEAAAAAAAAAAAECAwQFBgcICQoL/8QAtRAAAgEDAwIEAwUFBAQAAAF9AQIDAAQRBRIhMUEGE1FhByJxFDKBkaEII0KxwRVS0fAkM2JyggkKFhcYGRolJicoKSo0NTY3ODk6Q0RFRkdISUpTVFVWV1hZWmNkZWZnaGlqc3R1dnd4eXqDhIWGh4iJipKTlJWWl5iZmqKjpKWmp6ipqrKztLW2t7i5usLDxMXGx8jJytLT1NXW19jZ2uHi4+Tl5ufo6erx8vP09fb3+Pn6/8QAHwEAAwEBAQEBAQEBAQAAAAAAAAECAwQFBgcICQoL"
  } ]
}

Ejemplo de respuestas

Código de estado: 200

OK

{
  "success" : true,
  "results" : [ {
    "success" : true,
    "name" : "/test-obs/classify/input/cat-dog/2.jpg",
    "info" : "960585877c92d63911ba555ab3129d36"
  } ]
}

Códigos de estado

Código de estado

Descripción

200

OK

401

Unauthorized

403

Forbidden

404

Not Found

Códigos de error

Consulte Códigos de error.