更新时间:2025-08-20 GMT+08:00
分享

安装Device Plugin

  1. 编辑ma-dp-templates.yaml文件,将${image_name}替换为DevicePlugin插件镜像。

    swr.cn-east-4.myhuaweicloud.com/modelarts-rse/modelarts-device-plugin:7.0.0-20250803175043

  2. 在所有NPU节点增加标注的标签,其中<node_name>为真实的节点名称,可以通过kubectl get no获取。

    kubectl label nodes <node_name> accelerator/huawei-npu="" --overwrite

  3. 确认节点/var/lib/kubelet/pod-resources/目录下是否存在kubelet.sock套接字文件。若存在,则可以直接执行步骤4;若不存在,则需要修改ma-dp-templates.yaml文件中挂载路径。

    volumes:
      ...
      - name: pod-resources
        hostPath:
          path: /var/lib/kubelet/pod-resources   # 根据自建K8s指定路径中找到kubelet.sock文件所在路径,并修改该值

  4. 执行如下命令部署 modelarts-device-plugin。

    kubectl apply -f /mnt/deepseek/deploy/plugin/ma-dp-templates.yaml

  5. 执行下面的命令确认 modelarts-device-plugin 实例是否部署成功。

    kubectl get po -n kube-system | grep device-plugin

相关文档