更新时间:2024-09-14 GMT+08:00
分享

在DevServer上部署SD WebUI推理服务

本章节主要介绍如何在ModelArts的DevServer环境上部署Stable Diffusion的WebUI套件,使用NPU卡进行推理。

Step1 准备环境

  1. 请参考DevServer资源开通,购买DevServer资源,并确保机器已开通,密码已获取,能通过SSH登录,不同机器之间网络互通。

    购买DevServer资源时如果无可选资源规格,需要联系华为云技术支持申请开通。

    当容器需要提供服务给多个用户,或者多个用户共享使用该容器时,应限制容器访问Openstack的管理地址(169.254.169.254),以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据

  2. 检查环境。
    1. SSH登录机器后,检查NPU设备检查。运行如下命令,返回NPU设备信息。
      npu-smi info

      如出现错误,可能是机器上的NPU设备没有正常安装,或者NPU镜像被其他容器挂载。请先正常安装固件和驱动,或释放被挂载的NPU。

    2. 检查docker是否安装。
      docker -v   #检查docker是否安装

      如尚未安装,运行以下命令安装docker。

      yum install -y docker-engine.aarch64 docker-engine-selinux.noarch docker-runc.aarch64
    3. 配置IP转发,用于容器内的网络访问。执行以下命令查看net.ipv4.ip_forward配置项的值,如果为1,可跳过此步骤。
      sysctl -p | grep net.ipv4.ip_forward
      如果net.ipv4.ip_forward配置项的值不为1,执行以下命令配置IP转发。
      sed -i 's/net\.ipv4\.ip_forward=0/net\.ipv4\.ip_forward=1/g' /etc/sysctl.conf
      sysctl -p | grep net.ipv4.ip_forward、

Step2 制作自定义镜像

准备以下文件用于制作镜像。

  • 下载并解压表1中的AscendCloud插件包,进入aigc_inference/torch_npu/webui/v1_9_0_RC/ 和aigc_inference/torch_npu/diffusers/0_21_2/:
    v1_9_0_RC
    ├── gradio_adapt
          ├── gradio-3.14.2
                ├── Button-748313a7.js
                ├── index-2519a27e.js
    ├── ascend_extension
          ├── scripts
                ├── AscendPlugin.py
          ├── config.py
          ├── ...
    0_21_2
    ├── ascend_diffusers
          ├── src
          ├── setup.py
          ├── ...
  • 下载torch_npu安装包:

    下载:https://gitee.com/ascend/pytorch/releases/download/v6.0.rc2-pytorch2.1.0/torch_npu-2.1.0.post6-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl

    要保证torch版本为2.1.0,中间部分依赖安装可能会升级到2.2版本,最后一定要回退到2.1.0

  • 下载sd基础模型。

    下载v1-5模型:https://huggingface.co/benjamin-paine/stable-diffusion-v1-5/blob/main/v1-5-pruned-emaonly.safetensors(需登录)

    下载sdxl_base模型:https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0/resolve/main/sd_xl_base_1.0.safetensors

  • 编写Dockerfile文件:
    基于官方提供的基础镜像构建自定义镜像sdxl-train:0.0.1。参考如下命令编写Dockerfile文件。镜像地址{image_url}请参见表2
    FROM {image_url}
    
    # 下载sd webui源码
    RUN mkdir /home/ma-user/sdwebui
    RUN cd /home/ma-user/sdwebui && git config --global http.sslVerify false && git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
    
    # 切换到1.9.0版本
    RUN cd /home/ma-user/sdwebui/stable-diffusion-webui && git checkout e164031 
    
    # 下载controlnet插件
    RUN cd /home/ma-user/sdwebui/stable-diffusion-webui/extensions && git clone https://github.com/Mikubill/sd-webui-controlnet.git 
    RUN cd /home/ma-user/sdwebui/stable-diffusion-webui/extensions/sd-webui-controlnet && git checkout 92e4b12a73e61db6c1332dd52d9c35d59a7ebee1
    
    # 下载adtailer插件
    RUN cd /home/ma-user/sdwebui/stable-diffusion-webui/extensions && git clone https://github.com/Bing-su/adetailer.git
    
    # 下载nsfw插件
    RUN cd /home/ma-user/sdwebui/stable-diffusion-webui/extensions && git clone https://github.com/w-e-w/sd-webui-nudenet-nsfw-censor.git
    
    # 安装依赖
    WORKDIR /home/ma-user/sdwebui/stable-diffusion-webui
    RUN pip install -r requirements.txt -i http://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.aliyun.com
    
    COPY --chown=ma-user:ma-group v1-5-pruned-emaonly.safetensors /home/ma-user/sdwebui/stable-diffusion-webui/models/Stable-diffusion
    COPY --chown=ma-user:ma-group sd_xl_base_1.0.safetensors /home/ma-user/sdwebui/stable-diffusion-webui/models/Stable-diffusion
    
    # 复制华为侧代码包和插件
    COPY --chown=ma-user:ma-group index-2519a27e.js /home/ma-user/anaconda3/envs/PyTorch-2.2.0/lib/python3.10/site-packages/gradio/templates/frontend/assets
    COPY --chown=ma-user:ma-group Button-748313a7.js /home/ma-user/anaconda3/envs/PyTorch-2.2.0/lib/python3.10/site-packages/gradio/templates/frontend/assets
    COPY --chown=ma-user:ma-group ascend_extension /home/ma-user/sdwebui/stable-diffusion-webui/extensions/ascend_extension
    COPY --chown=ma-user:ma-group ascend_diffusers /home/ma-user/sdwebui/ascend_diffusers
    
    #  更换pytorch版本
    RUN pip uninstall -y torch torch_npu
    COPY --chown=ma-user:ma-group torch_npu-2.1.0.post6-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl /home/ma-user/
    RUN pip install torch==2.1.0 -i http://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.aliyun.com
    RUN cd /home/ma-user/ && pip install torch_npu-2.1.0.post6-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl
    RUN pip install torchvision==0.16.0
    
    
    # 安装ascend_diffusers
    RUN cd /home/ma-user/sdwebui/ascend_diffusers && pip install -e .
    WORKDIR /home/ma-user/sdwebui/stable-diffusion-webui
    # 禁用ssl验证
    RUN pip install requests==2.27.1
    RUN sed -i 's/self.verify = True/self.verify = False/g' /home/ma-user/anaconda3/envs/PyTorch-2.2.0/lib/python3.10/site-packages/requests/sessions.py
    # 禁止github上ssl验证
    RUN sed -i 's/-m pip {command} --prefer-binary{index_url_line}/-m pip {command} --prefer-binary{index_url_line} --trusted-host github.com --trusted-host codeload.github.com/g' /home/ma-user/sdwebui/stable-diffusion-webui/modules/launch_utils.py
    # 禁用ssl验证
    RUN sed -i '1i\import ssl\' launch.py && sed -i '2i\ssl._create_default_https_context = ssl._create_unverified_context\' launch.py && sed -i 's#\r##g' launch.py

    宿主机上文件目录如下:

    <docker_build>
    ├── v1-5-pruned-emaonly.safetensors #sd基础模型
    ├── sd_xl_base_1.0.safetensors #sd基础模型
    ├── index-2519a27e.js                          #  华为侧提供的代码文件
    ├── Button-748313a7.js                         #  华为侧提供的代码文件
    ├── torch_npu-2.1.0.post6-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl  #  torch_npu安装包
    ├── ascend_extension        #  华为侧提供的插件包
    ├── ascend_diffusers #华为侧提供的插件包
    ├── Dockerfile                           #  Dockerfile文件

    在该目录下执行命令构建自定义镜像:

    docker build -t sdxl-train:0.0.1 .

Step3 启动自定义镜像

执行以下命令启动自定义镜像。

docker run -itd --name ${container_name} -p 8183:8183 -v /sys/fs/cgroup:/sys/fs/cgroup:ro  -v /etc/localtime:/etc/localtime -v /usr/local/Ascend/driver:/usr/local/Ascend/driver -v /usr/local/bin/npu-smi:/usr/local/bin/npu-smi --shm-size 60g --device=/dev/davinci_manager --device=/dev/hisi_hdc --device=/dev/devmm_svm --device=/dev/davinci0  --security-opt seccomp=unconfined --network=bridge sdxl-train:0.0.1 bash

参数说明:

--name ${container_name}:容器名称,进入容器时会用到,此处可以自己定义一个容器名称。

--device=/dev/davinci0:挂载NPU设备,示例中挂载了单张卡davinci0。
  • driver及npu-smi需同时挂载至容器。
  • 不要将多个容器绑到同一个NPU上,会导致后续的容器无法正常使用NPU功能。

Step4 进入容器运行

  1. 进入容器后执行启动命令。
    docker exec -it ${container_name} bash
    python3 launch.py --port 8183 --skip-torch-cuda-test --enable-insecure-extension-access --listen --log-startup --disable-safe-unpickle --api

    等待克隆仓库,下载依赖模型,启动成功后显示如图1所示。

    图1 启动成功后显示

    如果在安装编译handrefinerportable时出错,则需手动下载whl包:

    wget https://github.com/huchenlei/HandRefinerPortable/releases/download/v1.0.1/handrefinerportable-2024.2.12.0-py2.py3-none-any.whl
    pip install handrefinerportable-2024.2.12.0-py2.py3-none-any.whl --no-deps
  2. 验证PyTorch版本,需要torch==2.1.0。
    pip list | grep torch
    #如果不是2.1.0版本,请重新安装
    pip uninstall torch
    pip install torch==2.1.0
  3. 验证效果。
    1. 新开启一个终端,执行以下命令。
      curl --noproxy '*' -kv -X POST localhost:8183/sdapi/v1/txt2img -H "Content-Type: application/json" -d '{"prompt":"ultrarealistic shot of a furry blue bird"}'

      执行成功显示:

      图2 执行成功显示
    2. 在浏览器输入http://{宿主机ip}:8183,可以访问前端页面,通过输入文字生成图片。
      图3 输入文字生成图片

      注意需要勾选Enable Flash Attention按钮。

      图4 Enable Flash Attention优化按钮

相关文档