Este conteúdo foi traduzido por máquina para sua conveniência e a Huawei Cloud não pode garantir que o conteúdo foi traduzido com precisão. Para exibir o conteúdo original, use o link no canto superior direito para mudar para a página em inglês.
Atualizado em 2024-09-14 GMT+08:00

Uso de uma imagem de base para criar uma imagem de treinamento

O ModelArts fornece imagens de base baseadas em aprendizado profundo, como imagens de TensorFlow, PyTorch e MindSpore. Nestas imagens, o software obrigatório para a execução de trabalhos de treinamento foi instalado. Se o software nas imagens de base não puder atender aos seus requisitos de serviço, crie novas imagens com base nas imagens de base e use as novas imagens para criar trabalhos de treinamento.

Procedimento

Execute as seguintes operações para criar uma imagem usando uma imagem de base de treinamento:

  1. Instale o Docker. Se o comando docker images é executado, o Docker foi instalado. Nesse caso, pule essa etapa.

    O seguinte usa o Linux x86_64 como um exemplo para descrever como obter o pacote de instalação do Docker. Execute o seguinte comando para instalar o Docker:

    curl -fsSL get.docker.com -o get-docker.sh
    sh get-docker.sh
  2. Crie uma pasta chamada context.
    mkdir -p context
  3. Obtenha o arquivo pip.conf.
    [global]
    index-url = https://repo.huaweicloud.com/repository/pypi/simple
    trusted-host = repo.huaweicloud.com
    timeout = 120
  4. Crie uma nova imagem com base em uma imagem de base de treinamento fornecida pelo ModelArts. Salve o Dockerfile editado na pasta context. Para obter detalhes sobre como obter uma imagem de base de treinamento, consulte Imagens de base de treinamento disponíveis.
    FROM {Path to the training base image provided by ModelArts}
    
    # Configure pip.
    RUN mkdir -p /home/ma-user/.pip/
    COPY --chown=ma-user:ma-group pip.conf /home/ma-user/.pip/pip.conf
    
    # Configure the preset environment variables of the container image.
    # Add the Python interpreter path to the PATH environment variable.
    # Set PYTHONUNBUFFERED to 1 to prevent log loss.
    ENV PATH=${ANACONDA_DIR}/envs/${ENV_NAME}/bin:$PATH \
        PYTHONUNBUFFERED=1
    
    RUN /home/ma-user/anaconda/bin/pip install --no-cache-dir numpy
  5. Execute o seguinte comando no diretório em que o Dockerfile está armazenado para criar uma imagem de contêiner, por exemplo, training:v1:
    docker build . -t training:v1
  6. Carregue a imagem nova para o SWR. Para mais detalhes, consulte Como acessar o SWR e carregar imagens para ele?.
  7. Use a imagem personalizada para criar um trabalho de treinamento no ModelArts. Para mais detalhes, consulte Uso de uma imagem personalizada para criar um trabalho de treinamento baseado em CPU ou GPU.