Etapa 2 Criar uma imagem personalizada
Esta seção descreve como editar um Dockerfile, usá-lo para criar uma imagem e usar a imagem criada para criar uma instância de notebook. Para obter detalhes sobre como editar um Dockerfile, consulte Referência do Dockerfile.
Pré-requisitos
Você preparou um servidor de Docker referindo-se a Etapa 1 Preparar um servidor de Docker e configurar um ambiente.
Consultar imagens de base (pular esta etapa para imagens de terceiros)
Para obter detalhes sobre imagens de base do ModelArts, consulte Lista de imagens de base do notebook. Verifique o URL da imagem na seção correspondente com base no tipo de mecanismo da imagem predefinida.
Criar uma imagem
- Acesse o SWR.
- Efetue logon no console do SWR.
- No painel de navegação à esquerda, escolha Dashboard e clique em Generate Login Command no canto superior direito. Na página exibida, copie o comando de logon.
Figura 1 Obter o comando de logon
- O período de validade do comando de logon gerado é de 24 horas. Para obter um comando de logon válido de longo prazo, consulte Obtenção de um comando de logon com validade de longo prazo. Depois de obter um comando de logon válido de longo prazo, seus comandos de logon temporários ainda serão válidos enquanto estiverem em seus períodos de validade.
- O nome de domínio no final do comando de logon é o endereço do repositório de imagens. Registre o endereço para uso posterior.
- Execute o comando de logon na máquina em que o mecanismo de contêiner está instalado.
A mensagem "Login Succeeded" será exibida após um logon bem-sucedido.
- Puxe uma imagem de base ou imagem de terceiros. O seguinte usa uma imagem de terceiros como exemplo.
docker pull swr.ap-southeast-1.myhuaweicloud.com/notebook-xxx/ubuntu:18.04 #Your organization name and image
- Compile um Dockerfile.
Execute o comando vim para criar um Dockerfile. Se uma imagem de base do ModelArts for usada, consulte Dockerfile em uma imagem de base do ModelArts para obter detalhes sobre o Dockerfile.
Se uma imagem de terceiros for usada, adicione o usuário ma-user cujo UID é 1000 e o grupo de usuários ma-group cujo GID é 100. Para mais detalhes, consulte Dockerfile em uma imagem de base não de ModelArts.
Nesse caso, PyTorch 1.8, FFmpeg 3 e GCC 8 serão instalados em uma imagem do Ubuntu para construir uma imagem de IA.
- Crie uma imagem.
Execute o comando docker build para criar uma nova imagem a partir do Dockerfile. A descrição dos parâmetros do comando é a seguinte:
- -t especifica o novo caminho da imagem, incluindo informações de região, nome da organização, nome da imagem e versão. Defina este parâmetro com base no cenário da vida real. Use um endereço do SWR completo para depuração e registro.
- -f especifica o nome do Dockerfile. Defina este parâmetro com base no cenário real.
- . no final especifica que o contexto é o diretório atual. Defina este parâmetro com base no cenário real.
docker build -t swr.ap-southeast-1.myhuaweicloud.com/notebook-xxx/pytorch_1_8:v1 -f Dockerfile .
Figura 2 Imagem criada
Dockerfile em uma imagem de base do ModelArts
Execute o comando vim para criar um Dockerfile. Se a imagem de base for fornecida pelo ModelArts, o conteúdo do Dockerfile será o seguinte:
FROM swr.ap-southeast-1.myhuaweicloud.com/atelier/notebook2.0-pytorch-1.4-kernel-cp37:3.3.3-release-v1-20220114 USER root # section1: config apt source RUN mv /etc/apt/sources.list /etc/apt/sources.list.bak && \ echo -e "deb http://repo.huaweicloud.com/ubuntu/ bionic main restricted\ndeb http://repo.huaweicloud.com/ubuntu/ bionic-updates main restricted\ndeb http://repo.huaweicloud.com/ubuntu/ bionic universe\ndeb http://repo.huaweicloud.com/ubuntu/ bionic-updates universe\ndeb http://repo.huaweicloud.com/ubuntu/ bionic multiverse\ndeb http://repo.huaweicloud.com/ubuntu/ bionic-updates multiverse\ndeb http://repo.huaweicloud.com/ubuntu/ bionic-backports main restricted universe multiverse\ndeb http://repo.huaweicloud.com/ubuntu bionic-security main restricted\ndeb http://repo.huaweicloud.com/ubuntu bionic-security universe\ndeb http://repo.huaweicloud.com/ubuntu bionic-security multiverse" > /etc/apt/sources.list && \ apt-get update # section2: install ffmpeg and gcc RUN apt-get -y install ffmpeg && \ apt -y install gcc-8 g++-8 && \ update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-8 80 --slave /usr/bin/g++ g++ /usr/bin/g++-8 && \ rm $HOME/.pip/pip.conf USER ma-user # section3: configure conda source and pip source RUN echo -e "channels:\n - defaults\nshow_channel_urls: true\ndefault_channels:\n - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main\n - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r\n - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2\ncustom_channels:\n conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud\n msys2: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud\n bioconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud\n menpo: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud\n pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud\n pytorch-lts: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud\n simpleitk: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud" > $HOME/.condarc && \ echo -e "[global]\nindex-url = https://pypi.tuna.tsinghua.edu.cn/simple\n[install]\ntrusted-host = https://pypi.tuna.tsinghua.edu.cn" > $HOME/.pip/pip.conf # section4: create a conda environment(only support python=3.7) and install pytorch1.8 RUN source /home/ma-user/anaconda3/bin/activate && \ conda create -y --name pytorch_1_8 python=3.7 && \ conda activate pytorch_1_8 && \ pip install torch==1.8.0 torchvision==0.9.0 torchaudio==0.8.0 && \ conda deactivate
Dockerfile em uma imagem de base não de ModelArts
Se uma imagem de terceiros for usada, adicione o usuário ma-user cujo UID é 1000 e o grupo de usuários ma-group cujo GID é 100 ao Dockerfile. Se UID 1000 ou GID 100 na imagem de base tiver sido usado por outro usuário ou grupo de usuários, exclua o usuário ou grupo de usuários. O usuário e o grupo de usuários foram adicionados ao Dockerfile nesse caso. Você pode usá-los diretamente.
Você só precisa definir o usuário ma-user cujo UID é 1000 e o grupo de usuários ma-group cujo GID é 100 e conceder as permissões de leitura, gravação e execução no diretório de destino ao usuário ma-user.
Execute o comando vim para criar um Dockerfile e adicione uma imagem de terceiros (não de ModelArts) como a imagem de base, por exemplo, ubuntu 18.04. O conteúdo do Dockerfile é o seguinte:
# Replace it with the actual image version. FROM ubuntu:18.04 # Set the user ma-user whose UID is 1000 and the user group ma-group whose GID is 10 USER root RUN default_user=$(getent passwd 1000 | awk -F ':' '{print $1}') || echo "uid: 1000 does not exist" && \ default_group=$(getent group 100 | awk -F ':' '{print $1}') || echo "gid: 100 does not exist" && \ if [ ! -z ${default_user} ] && [ ${default_user} != "ma-user" ]; then \ userdel -r ${default_user}; \ fi && \ if [ ! -z ${default_group} ] && [ ${default_group} != "ma-group" ]; then \ groupdel -f ${default_group}; \ fi && \ groupadd -g 100 ma-group && useradd -d /home/ma-user -m -u 1000 -g 100 -s /bin/bash ma-user && \ # Grant the read, write, and execute permissions on the target directory to the user ma-user. chmod -R 750 /home/ma-user #Configure the APT source and install the ZIP and Wget tools (required for installing conda). RUN mv /etc/apt/sources.list /etc/apt/sources.list.bak && \ echo "deb http://repo.huaweicloud.com/ubuntu/ bionic main restricted\ndeb http://repo.huaweicloud.com/ubuntu/ bionic-updates main restricted\ndeb http://repo.huaweicloud.com/ubuntu/ bionic universe\ndeb http://repo.huaweicloud.com/ubuntu/ bionic-updates universe\ndeb http://repo.huaweicloud.com/ubuntu/ bionic multiverse\ndeb http://repo.huaweicloud.com/ubuntu/ bionic-updates multiverse\ndeb http://repo.huaweicloud.com/ubuntu/ bionic-backports main restricted universe multiverse\ndeb http://repo.huaweicloud.com/ubuntu bionic-security main restricted\ndeb http://repo.huaweicloud.com/ubuntu bionic-security universe\ndeb http://repo.huaweicloud.com/ubuntu bionic-security multivers e" > /etc/apt/sources.list && \ apt-get update && \ apt-get install -y zip wget #Modifying the system Configuration of the image (required for creating the Conda environment) RUN rm /bin/sh && ln -s /bin/bash /bin/sh #Switch to user ma-user , download miniconda from the Tsinghua repository, and install miniconda in /home/ma-user. USER ma-user RUN cd /home/ma-user/ && \ wget --no-check-certificate https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-4.6.14-Linux-x86_64.sh && \ bash Miniconda3-4.6.14-Linux-x86_64.sh -b -p /home/ma-user/anaconda3 && \ rm -rf Miniconda3-4.6.14-Linux-x86_64.sh #Configure the conda and pip sources RUN mkdir -p /home/ma-user/.pip && \ echo -e "channels:\n - defaults\nshow_channel_urls: true\ndefault_channels:\n - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main\n - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r\n - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2" > /home/ma-user/.condarc && \ echo -e "[global]\nindex-url = https://pypi.tuna.tsinghua.edu.cn/simple\n[install]\ntrusted-host = https://pypi.tuna.tsinghua.edu.cn" > /home/ma-user/.pip/pip.conf #Create the conda environment and install the Python third-party package. The ipykernel package is mandatory for starting a kernel. RUN source /home/ma-user/anaconda3/bin/activate && \ conda create -y --name pytorch_1_8 python=3.7 && \ conda activate pytorch_1_8 && \ pip install torch==1.8.1 torchvision==0.9.1 && \ pip install ipykernel==6.7.0 && \ conda init bash && \ conda deactivate #Install FFmpeg and GCC USER root RUN apt-get -y install ffmpeg && \ apt -y install gcc-8 g++-8