文档首页/
AI开发平台ModelArts/
最佳实践/
DeepSeek&Qwen3基于Lite Server&Cluster推理/
DeepSeek&Qwen3模型基于Lite Server适配NPU的PD分离推理解决方案/
准备、安装部署依赖/
Device Plugin的安装与升级/
安装Device Plugin
更新时间:2025-11-04 GMT+08:00
安装Device Plugin
- 执行以下命令进入插件安装目录。
cd /mnt/deepseek/deploy/plugin
- 编辑modelarts-device-plugin/values.yaml文件。
vi modelarts-device-plugin/values.yaml
- 将${image_tag}替换为表2中DevicePlugin插件镜像标签。
image: repository: "swr.cn-east-4.myhuaweicloud.com" baseName: "modelarts-rse" name: "modelarts-device-plugin" tag: "${image_tag}" ... - 确认节点/var/lib/kubelet/pod-resources/目录下是否存在kubelet.sock套接字文件。若存在,则可以直接执行步骤4;若不存在,则需要修改modelarts-device-plugin/templates/modelarts-device-plugin-daemonset.yaml文件中挂载路径。
volumes: ... - name: pod-resources hostPath: path: /var/lib/kubelet/pod-resources # 根据自建K8s指定路径中找到kubelet.sock文件所在路径,并修改该值,例如/root/kubernetes/var/lib/kubelet/pod-resources - 在K8s control-plane控制平面节点上对所有纳管的NPU节点增加标注的标签,其中<node_name>为真实的节点名称,可以通过kubectl get no获取。
kubectl label nodes <node_name> accelerator/huawei-npu="" --overwrite
- 执行如下命令部署 DevicePlugin。(需要先安装Helm)
helm install madp ./modelarts-device-plugin/ -f ./modelarts-device-plugin/values.yaml -n kube-system
- (可选)如果通过其他方式安装过DevicePlugin,需要先删除原有DevicePlugin。
kubectl delete ds modelarts-device-plugin -n kube-system kubectl delete serviceaccount modelarts-device-plugin -n kube-system kubectl delete clusterrole system:modelarts-device-plugin kubectl delete clusterrolebinding system:modelarts-device-plugin
- 执行下面的命令确认DevicePlugin实例是否部署成功。
kubectl get po -n kube-system | grep device-plugin

父主题: Device Plugin的安装与升级