更新时间:2025-09-26 GMT+08:00
分享

版本软件说明和要求

版本差异说明

本文档支持昇腾云6.5.906及以后版本,最新版本是6.5.907。推荐使用最新版本配套的软件包和镜像。

表1 版本差异说明

版本

说明

6.5.907

相对于6.5.906版本,6.5.907有以下新增支持特性:

  1. VeRL强化学习框架:新增Qwen2.5VL系列/Qwen3系列模型/Qwen2.5系列模型支持PPO/DAPO/GRPO。
  2. Llama-Factory框架:新增Qwen2.5-14B、Qwen2.5-VL-7B、Qwen2.5-72B支持DPO强化学习
  3. MindSpeed-MM框架:新增Qwen2.5VL-7B、Qwen2.5VL-3B模型支持预训练和微调。

相对于6.5.906版本,6.5.907有以下特性变更不支持:

  1. Llama-Factory框架:Internvl2.5-8B、Internvl2.5-38B、Internvl2.5-78B不支持full和lora微调。

6.5.906

相对于6.5.905版本,6.5.906有以下特性变更:

  1. MindSpeed_RL强化学习框架:支持Qwen2.5系列模型的GRPO算法训练。
  2. VeRL强化学习框架:支持大语言模型Qwen3-8B、多模态模型Qwen2.5_vl系列模型。

基础镜像版本

本教程中用到的训练基础镜像地址和配套版本关系如下表所示,请提前了解。

表2 基础容器镜像地址

镜像用途

镜像地址

配套版本

基础镜像Snt9b

西南-贵阳一:

swr.cn-southwest-2.myhuaweicloud.com/atelier/pytorch_ascend:pytorch_2.5.1-cann_8.2.rc1-py_3.11-hce_2.0.2503-aarch64-snt9b-20250729103313-3a25129

中国-香港:

swr.ap-southeast-1.myhuaweicloud.com/atelier/pytorch_ascend:pytorch_2.5.1-cann_8.2.rc1-py_3.11-hce_2.0.2503-aarch64-snt9b-20250729103313-3a25129

6.5.907

基础镜像Snt9b23

西南-贵阳一:

swr.cn-southwest-2.myhuaweicloud.com/atelier/pytorch_ascend:pytorch_2.5.1-cann_8.2.rc1-py_3.11-hce_2.0.2503-aarch64-snt9b23-20250729103313-3a25129

中国-香港

swr.ap-southeast-1.myhuaweicloud.com/atelier/pytorch_ascend:pytorch_2.5.1-cann_8.2.rc1-py_3.11-hce_2.0.2503-aarch64-snt9b23-20250729103313-3a25129

6.5.907

表3 基础容器镜像地址(DeepSeek专用)

镜像用途

镜像地址

配套版本

基础镜像Snt9b(DeepSeek专用)

西南-贵阳一:

swr.cn-southwest-2.myhuaweicloud.com/atelier/pytorch_2_1_ascend:pytorch_2.1.0-cann_8.2.rc1-py_3.11-hce_2.0.2503-aarch64-snt9b-20250729103313-3a25129

中国-香港

swr.ap-southeast-1.myhuaweicloud.com/atelier/pytorch_2_1_ascend:pytorch_2.1.0-cann_8.2.rc1-py_3.11-hce_2.0.2503-aarch64-snt9b-20250729103313-3a25129

6.5.907

基础镜像Snt9b23(DeepSeek专用)

西南-贵阳一:

swr.cn-southwest-2.myhuaweicloud.com/atelier/pytorch_2_1_ascend:pytorch_2.1.0-cann_8.2.rc1-py_3.11-hce_2.0.2503-aarch64-snt9b23-20250729103313-3a25129

中国-香港:

swr.ap-southeast-1.myhuaweicloud.com/atelier/pytorch_2_1_ascend:pytorch_2.1.0-cann_8.2.rc1-py_3.11-hce_2.0.2503-aarch64-snt9b23-20250729103313-3a25129

6.5.907

表4 模型镜像版本

机型

模型

版本

Snt9b

CANN

8.2.RC1

驱动

25.2.1

PyTorch

2.5.1

2.1.0(DeepSeek配套)

Snt9b23

CANN

8.2.RC1

驱动

25.2.1

PyTorch

2.5.1

2.1.0 (DeepSeek配套)

软件包获取

本方案需要使用到的软件配套版本和依赖包获取地址如下表所示。

表5 软件配套版本和获取地址

昇腾云版本

软件名称

说明

下载地址

6.5.907

AscendCloud-6.5.907-timestamp.zip

包含了本教程中使用到的训练代码。

1. 获取路径:Support-E

2. 找到对应的版本:ModelArts 6.5.907.1

说明:

如果上述软件获取路径打开后未显示相应的软件信息,说明您没有下载权限,请联系您所在企业的华为方技术支持下载获取。

软件包结构

AscendCloud-LLM代码包关键训练文件介绍如下:
|——AscendCloud-LLM
  |──llm_train                    # 模型训练代码包
    |──AscendFactory   
      |──examples/                # config配置文件目录
      |──data.tgz                 # 样例数据压缩包
      |──third-party/             # patch包
      |──src/acs_train_solution/  # 训练运行包
      |──intall.sh                # 初始化环境执行脚本
      |──Dockerfile               
      |──scripts_install          # 各个框架的安装脚本包      
      |──dependences.yaml         # 开源社区代码版本yaml文件     

相关文档