更新时间:2025-08-20 GMT+08:00
分享

部署依赖包版本说明

获取部署版本包

  1. 获取推理部署版本包。

    Support-E中查找ModelArts 6.5.T906-Compello版本,下载ModelArts 6.5.T906-Compello版本包,部署版本包名称为:AscendCloud-Solution-6.5.906-{timestamp}.zip。

  2. 将部署配套文件上传至存储配置中的挂载目录,例如:/mnt/deepseek/deploy。

    AscendCloud-Solution-6.5.906-{timestamp}/
    ├── llm_infer/
    │    └── deploy/                          # 推理部署配套文件,上传至共享盘并挂载
    │          ├── ray_log_rotate/            # Ray日志滚动配置文件
    │          ├── plugin/                    # 插件部署文件
    │          │    ├──volcano/              # volcano部署文件
    │          │    │   ├──templates/
    │          │    │   └──......
    │          │    ├──ma-dp-templates.yaml  # DevicePlugin部署文件
    │          │    └──kubeinfer-crd.yaml    # KubeInfer部署文件
    │          ├── *.sh                       # 推理部署依赖脚本
    │          └── *.py                       # 推理部署依赖脚本

  3. 执行如下命令给予脚本执行权限

    dos2unix /mnt/deepseek/deploy/*
    dos2unix /mnt/deepseek/deploy/ray_log_rotate/*
    chmod -R 750 /mnt/deepseek/deploy/

组件说明

部署过程中涉及的主要组件及其版本和功能说明如表1所示,部署依赖包的获取方式如表2所示。其余在Lite Server资源开通后自动安装的组件配套关系见ModelArts版本配套关系表

表1 组件版本与镜像

组件

版本号

镜像地址

功能说明

volcano

1.16.8

swr.cn-east-4.myhuaweicloud.com/hwofficial/volcano-admission:1.16.8

swr.cn-east-4.myhuaweicloud.com/hwofficial/volcano-controllers:1.16.8

swr.cn-east-4.myhuaweicloud.com/hwofficial/volcano-scheduler:1.16.8

工作负载调度引擎

modelarts-device-plugin

7.0.0-20250803175043

swr.cn-east-4.myhuaweicloud.com/modelarts-rse/modelarts-device-plugin:7.0.0-20250803175043

NPU设备管理插件

modelarts-infers-operator

1.5.1.20250808112402

swr.cn-east-4.myhuaweicloud.com/atelier/modelarts-infers-operator:1.5.1.20250808112402

K8s CRD插件,即KubeInfer,用于部署推理服务

表2 部署依赖包获取方式

部署文件(均放置在master节点)

功能说明

获取方式

helm-v3.14.1-linux-arm64.tar.gz

Helm 是 Kubernetes 的包管理器

wget https://get.helm.sh/helm-v3.14.1-linux-arm64.tar.gz

volcano

Volcano 部署文件

获取部署版本包

ma-dp-templates.yaml

modelarts-device-plugin 部署文件

kubeinfer-crd.yaml

Kubeinfer 部署文件

相关文档