版本说明和要求
训练软件包版本差异说明
本文档支持昇腾云6.5.906及以后版本,最新版本是6.5.912。推荐使用最新版本配套的软件包和镜像。
训练框架版本
- LlamaFactory框架版本:0.9.4
- MindSpeed-LLM框架版本:2.2.0
- MindSpeed-MM框架版本:2.2.0
- VeRL框架版本:0.5.0.dev
基础镜像版本
本教程中用到的训练基础镜像地址和配套版本关系如下表所示,请提前了解。
| 镜像用途 | 适用区域 | 镜像地址 | 配套版本 |
|---|---|---|---|
| 基础镜像Snt9b | 西南-贵阳一 | LLaMA-Factory、MindSpeed-LLM使用: swr.cn-southwest-2.myhuaweicloud.com/atelier/pytorch_ascend:pytorch_2.5.1-cann_8.2.rc2-py_3.11-hce_2.0.2509-aarch64-snt9b-20251105194139-a70c13c VeRL、MindSpeed-MM使用: swr.cn-southwest-2.myhuaweicloud.com/atelier/pytorch_ascend:pytorch_2.7.1-cann_8.3.rc1-py_3.11-hce_2.0.2509-aarch64-snt9b-20251111171115-ca4b9da | 6.5.912 |
| 华东二 | LLaMA-Factory、MindSpeed-LLM使用: swr.cn-east-4.myhuaweicloud.com/atelier/pytorch_ascend:pytorch_2.5.1-cann_8.2.rc2-py_3.11-hce_2.0.2509-aarch64-snt9b-20251105194139-a70c13c VeRL、MindSpeed-MM使用: swr.cn-east-4.myhuaweicloud.com/atelier/pytorch_ascend:pytorch_2.7.1-cann_8.3.rc1-py_3.11-hce_2.0.2509-aarch64-snt9b-20251111171115-ca4b9da | ||
| 中国-香港 | LLaMA-Factory、MindSpeed-LLM使用: swr.ap-southeast-1.myhuaweicloud.com/atelier/pytorch_ascend:pytorch_2.5.1-cann_8.2.rc2-py_3.11-hce_2.0.2509-aarch64-snt9b-20251105194139-a70c13c VeRL、MindSpeed-MM使用: swr.ap-southeast-1.myhuaweicloud.com/atelier/pytorch_ascend:pytorch_2.7.1-cann_8.3.rc1-py_3.11-hce_2.0.2509-aarch64-snt9b-20251111171115-ca4b9da | ||
| 基础镜像Snt9b23 | 西南-贵阳一 | LLaMA-Factory、MindSpeed-LLM使用: swr.cn-southwest-2.myhuaweicloud.com/atelier/pytorch_ascend:pytorch_2.5.1-cann_8.2.rc2-py_3.11-hce_2.0.2509-aarch64-snt9b23-20251106111344-87d9583 VeRL、MindSpeed-MM使用: swr.cn-southwest-2.myhuaweicloud.com/atelier/pytorch_ascend:pytorch_2.7.1-cann_8.3.rc1-py_3.11-hce_2.0.2509-aarch64-snt9b23-20251119122703-d180abf | 6.5.912 |
| 华东二 | LLaMA-Factory、MindSpeed-LLM使用: swr.cn-east-4.myhuaweicloud.com/atelier/pytorch_ascend:pytorch_2.5.1-cann_8.2.rc2-py_3.11-hce_2.0.2509-aarch64-snt9b23-20251106111344-87d9583 VeRL、MindSpeed-MM使用: swr.cn-east-4.myhuaweicloud.com/atelier/pytorch_ascend:pytorch_2.7.1-cann_8.3.rc1-py_3.11-hce_2.0.2509-aarch64-snt9b23-20251119122703-d180abf | ||
| 中国-香港 | LLaMA-Factory、MindSpeed-LLM使用: swr.ap-southeast-1.myhuaweicloud.com/atelier/pytorch_ascend:pytorch_2.5.1-cann_8.2.rc2-py_3.11-hce_2.0.2509-aarch64-snt9b23-20251106111344-87d9583 VeRL、MindSpeed-MM使用: swr.ap-southeast-1.myhuaweicloud.com/atelier/pytorch_ascend:pytorch_2.7.1-cann_8.3.rc1-py_3.11-hce_2.0.2509-aarch64-snt9b23-20251119122703-d180abf |
| 机型 | 模型 | 版本 |
|---|---|---|
| Snt9b | CANN | 8.2.RC2 |
| 驱动 | 24.1.0.6 | |
| PyTorch | 2.5.1 | |
| Snt9b23 | CANN | 8.2.RC2 |
| 驱动 | 25.2.1 | |
| PyTorch | 2.5.1 |
| 机型 | 模型 | 版本 |
|---|---|---|
| Snt9b | CANN | 8.3.RC1 |
| 驱动 | 25.2.1 | |
| PyTorch | 2.7.1 | |
| Snt9b23 | CANN | 8.3.RC1 |
| 驱动 | 25.2.1 | |
| PyTorch | 2.7.1 |
软件包获取
本方案需要使用到的软件配套版本和依赖包获取地址如下表所示。
| 昇腾云版本 | 软件名称 | 说明 | 下载地址 |
|---|---|---|---|
| 6.5.912 | AscendCloud-6.5.912-timestamp.zip | 包含了本教程中使用到的训练代码包。 | 1. 获取路径:Support-E。 2. 找到对应的版本:ModelArts 6.5.912 说明: 如果上述软件获取路径打开后未显示相应的软件信息,说明您没有下载权限,请联系您所在企业的华为方技术支持下载获取。 |
软件包结构
|——AscendCloud-LLM
|──llm_train/AscendFactory/ # 模型训练代码包
|──install/ # 各个框架的安装脚本包
|──docker/ # dockerfile文件目录
|──src # 训练运行包
|──ascend_factory/ # 训练运行包
|──open_source/ # 三方包git目录
|──open_source_adaptor/ # ascend适配优化patch包目录
|──install.sh # 初始化环境执行脚本
|──data.tgz # 样例数据压缩包