¿Cómo configuro los datos de entrada y salida para los modelos de entrenamiento de ModelArts?
ModelArts le permite cargar un algoritmo personalizado para crear trabajos de entrenamiento. Crear el algoritmo y subirlo a un bucket de OBS. Para obtener más información sobre cómo crear un algoritmo, consulte Creación de un algoritmo. Para obtener más información sobre cómo crear un trabajo de entrenamiento, consulte Creación de un trabajo de entrenamiento.
Análisis de rutas de entrada y de salida
Cuando un modelo de ModelArts lee datos almacenados en OBS o envía datos a una ruta de OBS especificada, realice las siguientes operaciones para configurar los datos de entrada y de salida:
- Analice las rutas de entrada y de salida en el código de entrenamiento. Se recomienda el siguiente método:
1 2 3 4 5 6 7 8 9 10
import argparse # Create a parsing task. parser = argparse.ArgumentParser(description="train mnist", formatter_class=argparse.ArgumentDefaultsHelpFormatter) # Add parameters. parser.add_argument('--train_url', type=str, help='the path model saved') parser.add_argument('--data_url', type=str, help='the training data') # Parse the parameters. args, unknown = parser.parse_known_args()
Después de analizar los parámetros, use data_url y train_url para reemplazar las rutas a la fuente de datos y la salida de datos, respectivamente.
- Cuando utilice una imagen preestablecida para crear un algoritmo personalizado, configure los parámetros de entrada y salida en la página Create Algorithm según la configuración del código.
- Los datos de entrenamiento son una necesidad para el despliegue de algoritmos. De forma predeterminada, los datos de entrada son Data Source y el parámetro de ruta de código es data_url (personalizable).
Figura 1 Análisis del parámetro de ruta de entrada data_url
- Después de completar el entrenamiento del modelo, el modelo entrenado y la información de salida deben almacenarse en una ruta de OBS. Por defecto, el dato de salida es Output Data y el parámetro de ruta de código es train_url (personalizable).
Figura 2 Análisis del parámetro de ruta de salida train_url
- Los datos de entrenamiento son una necesidad para el despliegue de algoritmos. De forma predeterminada, los datos de entrada son Data Source y el parámetro de ruta de código es data_url (personalizable).
- Al crear un trabajo de entrenamiento, establezca las rutas de entrada y salida.
Seleccione la ruta de OBS o la ruta del conjunto de datos como la entrada de entrenamiento y la ruta de OBS como la salida.
Figura 3 Ajuste de entrada y salida de entrenamiento