在DevServer上部署SD WebUI推理服务

本章节主要介绍如何在ModelArts的DevServer环境上部署Stable Diffusion的WebUI套件，使用NPU卡进行推理。

Step1 准备环境

请参考DevServer资源开通，购买DevServer资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。

购买DevServer资源时如果无可选资源规格，需要联系华为云技术支持申请开通。

当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。
检查环境。
1. SSH登录机器后，检查NPU设备检查。运行如下命令，返回NPU设备信息。
```
npu-smi info
```
  如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。
2. 检查docker是否安装。
```
docker -v   #检查docker是否安装
```
  如尚未安装，运行以下命令安装docker。
```
yum install -y docker-engine.aarch64 docker-engine-selinux.noarch docker-runc.aarch64
```
3. 配置IP转发，用于容器内的网络访问。执行以下命令查看net.ipv4.ip_forward配置项的值，如果为1，可跳过此步骤。
```
sysctl -p | grep net.ipv4.ip_forward
```
  如果net.ipv4.ip_forward配置项的值不为1，执行以下命令配置IP转发。
```
sed -i 's/net\.ipv4\.ip_forward=0/net\.ipv4\.ip_forward=1/g' /etc/sysctl.conf
sysctl -p | grep net.ipv4.ip_forward、
```

Step2 制作自定义镜像

准备以下文件用于制作镜像。

下载并解压表1中的AscendCloud插件包，进入aigc_inference/torch_npu/webui/v1_9_0_RC/ 和aigc_inference/torch_npu/diffusers/0_21_2/：

v1_9_0_RC
├── gradio_adapt
      ├── gradio-3.14.2
            ├── Button-748313a7.js
            ├── index-2519a27e.js
├── ascend_extension
      ├── scripts
            ├── AscendPlugin.py
      ├── config.py
      ├── ...
0_21_2
├── ascend_diffusers
      ├── src
      ├── setup.py
      ├── ...

下载sd基础模型。
下载v1-5模型：https://huggingface.co/benjamin-paine/stable-diffusion-v1-5/blob/main/v1-5-pruned-emaonly.safetensors（需登录）

下载sdxl_base模型：https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0/resolve/main/sd_xl_base_1.0.safetensors

编写Dockerfile文件：

基于官方提供的基础镜像构建自定义镜像sdxl-train:0.0.1。参考如下命令编写Dockerfile文件。镜像地址{image_url}请参见表2。

FROM {image_url}


# 下载sd webui源码
RUN mkdir /home/ma-user/sdwebui
RUN cd /home/ma-user/sdwebui && git config --global http.sslVerify false && git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

# 切换到1.9.0版本
RUN cd /home/ma-user/sdwebui/stable-diffusion-webui && git checkout e164031 

# 下载controlnet插件
RUN cd /home/ma-user/sdwebui/stable-diffusion-webui/extensions && git clone https://github.com/Mikubill/sd-webui-controlnet.git 
RUN cd /home/ma-user/sdwebui/stable-diffusion-webui/extensions/sd-webui-controlnet && git checkout 92e4b12a73e61db6c1332dd52d9c35d59a7ebee1

# 下载nsfw插件
RUN cd /home/ma-user/sdwebui/stable-diffusion-webui/extensions && git clone https://github.com/w-e-w/sd-webui-nudenet-nsfw-censor.git

# 安装依赖
WORKDIR /home/ma-user/sdwebui/stable-diffusion-webui
RUN pip install -r requirements.txt -i http://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.aliyun.com

COPY --chown=ma-user:ma-group v1-5-pruned-emaonly.safetensors /home/ma-user/sdwebui/stable-diffusion-webui/models/Stable-diffusion
COPY --chown=ma-user:ma-group sd_xl_base_1.0.safetensors /home/ma-user/sdwebui/stable-diffusion-webui/models/Stable-diffusion

# 复制华为侧代码包和插件
COPY --chown=ma-user:ma-group index-2519a27e.js /home/ma-user/anaconda3/envs/PyTorch-2.1.0/lib/python3.9/site-packages/gradio/templates/frontend/assets
COPY --chown=ma-user:ma-group Button-748313a7.js /home/ma-user/anaconda3/envs/PyTorch-2.1.0/lib/python3.9/site-packages/gradio/templates/frontend/assets
COPY --chown=ma-user:ma-group ascend_extension /home/ma-user/sdwebui/stable-diffusion-webui/extensions/ascend_extension
COPY --chown=ma-user:ma-group ascend_diffusers /home/ma-user/sdwebui/ascend_diffusers

# 安装ascend_diffusers
RUN cd /home/ma-user/sdwebui/ascend_diffusers && pip install -e .
WORKDIR /home/ma-user/sdwebui/stable-diffusion-webui

# 禁用ssl验证
RUN pip install requests==2.27
RUN sed -i 's/self.verify = True/self.verify = False/g' /home/ma-user/anaconda3/envs/PyTorch-2.1.0/lib/python3.9/site-packages/requests/sessions.py
# 禁止github上ssl验证
RUN sed -i 's/-m pip {command} --prefer-binary{index_url_line}/-m pip {command} --prefer-binary{index_url_line} --trusted-host github.com --trusted-host codeload.github.com/g' /home/ma-user/sdwebui/stable-diffusion-webui/modules/launch_utils.py
# 禁用ssl验证
RUN sed -i '1i\import ssl\' launch.py && sed -i '2i\ssl._create_default_https_context = ssl._create_unverified_context\' launch.py && sed -i 's#\r##g' launch.py

宿主机上文件目录如下：

<docker_build>
├── v1-5-pruned-emaonly.safetensors   #sd基础模型
├── sd_xl_base_1.0.safetensors  #sd基础模型
├── index-2519a27e.js                          #  华为侧提供的代码文件
├── Button-748313a7.js                         #  华为侧提供的代码文件
├── ascend_extension        #  华为侧提供的插件包
├── ascend_diffusers  #  华为侧提供的插件包
├── Dockerfile                           #  Dockerfile文件

在该目录下执行命令构建自定义镜像：

docker build -t sdxl-train:0.0.1 .

Step3 启动自定义镜像

执行以下命令启动自定义镜像。

docker run -itd --name ${container_name} -p 8183:8183 -v /sys/fs/cgroup:/sys/fs/cgroup:ro  -v /etc/localtime:/etc/localtime -v /usr/local/Ascend/driver:/usr/local/Ascend/driver -v /usr/local/bin/npu-smi:/usr/local/bin/npu-smi --shm-size 60g --device=/dev/davinci_manager --device=/dev/hisi_hdc --device=/dev/devmm_svm --device=/dev/davinci0  --security-opt seccomp=unconfined --network=bridge sdxl-train:0.0.1 bash

参数说明：

--name ${container_name}：容器名称，进入容器时会用到，此处可以自己定义一个容器名称。

--device=/dev/davinci0：挂载NPU设备，示例中挂载了单张卡davinci0。

driver及npu-smi需同时挂载至容器。
不要将多个容器绑到同一个NPU上，会导致后续的容器无法正常使用NPU功能。

Step4 进入容器运行

进入容器后执行启动命令。

docker exec -it ${container_name} bash
python3 launch.py --port 8183 --skip-torch-cuda-test --enable-insecure-extension-access --listen --log-startup --disable-safe-unpickle --api

等待克隆仓库，下载依赖模型，启动成功后显示

图1 启动成功后显示

验证效果。
1. 新开启一个终端，执行以下命令。
```
curl --noproxy '*' -kv -X POST localhost:8183/sdapi/v1/txt2img -H "Content-Type: application/json" -d '{"prompt":"ultrarealistic shot of a furry blue bird"}'
```
  执行成功显示：
  
  图2 执行成功显示
2. 在浏览器输入http://{宿主机ip}:8183，可以访问前端页面，通过输入文字生成图片。
  图3 输入文字生成图片
  
  注意需要勾选Enable Flash Attention按钮。
  
  图4 Enable Flash Attention优化按钮