Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Centro de ayuda> ModelArts> Preguntas frecuentes> ExeML> Preparación de datos> ¿Cuáles son los requisitos para los datos de entrenamiento cuando crea un proyecto de análisis predictivo en ExeML?
Actualización más reciente 2023-10-09 GMT+08:00

¿Cuáles son los requisitos para los datos de entrenamiento cuando crea un proyecto de análisis predictivo en ExeML?

Requisitos sobre conjuntos de datos

  • El conjunto de datos consta de letras, dígitos, guiones (-) y guiones bajos (_), y debe estar en formato CSV. Los archivos de datos no se pueden almacenar en el directorio raíz de un bucket de OBS, sino en una carpeta del bucket de OBS, por ejemplo /obs-xxx/data/input.csv.
  • Utilice caracteres de nueva línea (\n o LF) para separar líneas y comas (,) para separar columnas en el contenido del archivo. El contenido del archivo no puede incluir símbolos que no sean inglés (por ejemplo, caracteres chinos). El contenido de la columna no puede contener caracteres especiales como comas, saltos de línea o comillas. Se recomienda que el contenido de la columna consista únicamente en letras y números.
  • Entrenamiento de datos
    • El número de columnas en los datos de entrenamiento debe ser el mismo, y debe haber al menos 100 registros de datos (una característica con valores diferentes se considera como registros de datos diferentes).
    • Las columnas de entrenamiento no pueden contener formatos de marca de tiempo (como aa-mm-dd y aaaa-mm-dd).
    • Si una columna tiene solo un valor, la columna se considera no válida. Asegúrese de que hay al menos dos valores en la columna de etiqueta y de que no faltan datos.

      La columna de etiqueta es el destino de entrenamiento especificado en una tarea de entrenamiento. Es la salida (elemento de predicción) para el modelo entrenado usando el conjunto de datos.

    • Además de la columna de etiqueta, el conjunto de datos debe contener al menos dos columnas de elemento válidas. Asegúrese de que hay al menos dos valores en cada columna de elemento y de que el porcentaje de datos que faltan debe ser inferior al 10%.
    • El archivo CSV no puede contener un encabezado de tabla o el entrenamiento fallará.

Preparación de datos Preguntas frecuentes

more