更新时间:2025-10-14 GMT+08:00
分享

升级Device Plugin(可选)

约束限制

1. 升级过程中存在单Pod中DP实例不可用。

2. 升级过程中不允许下发新作业任务

如果您需要回退到旧版本,也可以参照以下升级步骤进行操作。

  1. 查看当前集群中的DevicePlugin实例。

    kubectl get po -n kube-system | grep device-plugin

  2. 编辑modelarts-device-plugin/values.yaml文件。

    vi modelarts-device-plugin/values.yaml

  3. 将${image_tag}替换为表2中DevicePlugin插件镜像标签。

    image:
      repository: "swr.cn-east-4.myhuaweicloud.com"
      baseName: "modelarts-rse"
      name: "modelarts-device-plugin"
      tag: "${image_tag}"
    ...

  4. 执行如下命令升级DevicePlugin。

    helm upgrade madp ./modelarts-device-plugin/ -f ./modelarts-device-plugin/values.yaml -n kube-system

  5. 执行如下命令确认DevicePlugin实例升级成功。

    kubectl get po -n kube-system | grep device-plugin

相关文档