准备代码

本教程中用到的训练、推理代码如下表所示，请提前准备好。

获取模型软件包和权重文件

本方案支持的模型对应的软件和依赖包获取地址如表1所示，模型列表、对应的开源权重获取地址如表1所示。

表1 模型对应的软件包和依赖包获取地址
代码包名称	代码说明	下载地址
AscendCloud-6.3.908-xxx.zip 说明：软件包名称中的xxx表示时间戳。	包含了本教程中使用到的模型训练代码、推理部署代码和推理评测代码。代码包具体说明请参见模型软件包结构说明。 AscendSpeed是用于模型并行计算的框架，其中包含了许多模型的输入处理方法。	获取路径：Support-E 请联系您所在企业的华为方技术支持下载获取。

模型软件包结构说明

本教程需要使用到的AscendCloud-6.3.908中的AscendCloud-LLM-xxx.zip软件包和算子包AscendCloud-OPP，AscendCloud-LLM关键文件介绍如下。

|——AscendCloud-LLM
    |──llm_train                         # 模型训练代码包
          |──LLaMAFactory                # 基于LLaMAFactory的训练代码
                 |──ascendcloud_patch/   # 针对昇腾云平台适配的功能补丁包
                 |──demo.yaml            # 样例yaml配置文件
                 |──demo.sh              # 指令微调启动shell脚本
                 |──intall.sh            # 需要的依赖包
                 |──LLaMA-Factory        # LLaMAFactory的代码目录
           |──AscendSpeed                # 基于AscendSpeed的训练代码

工作目录介绍

详细的工作目录参考如下，建议参考以下要求设置工作目录。

${workdir}（例如/home/ma-user/ws ）
|──llm_train                    #解压代码包后自动生成的代码目录，无需用户创建
      |── LLaMAFactory                # 代码目录
              |──ascendcloud_patch/   # 针对昇腾云平台适配的功能代码包
              |──demo.sh              # 指令微调启动shell脚本
              |──demo.yaml            # 样例yaml配置文件
              |──intall.sh            # 需要的依赖包
              |──LLaMA-Factory        # 执行install.sh后生成此目录,容器内执行参考Step3 启动容器镜像
                   |──data            # 原始数据目录，如使用自定义数据，参考准备数据（可选）
|── tokenizers                        #原始权重/tokenizer目录，用户手动创建，用户根据实际规划目录修改，后续操作步骤中会提示
      |── Qwen2-72B
# 输出权重及日志路径，用户可根据实际自行规划，无需手动创建，此路径对应表1表格中output_dir参数值
|── saved_dir_for_output_lf            # 训练输出保存权重，目录结构会自动生成，无需用户创建
      |── ${model_name}                # 模型名称,根据实际训练模型创建，训练完成权重文件及日志目录

上传代码和权重文件到工作环境

使用root用户以SSH的方式登录DevServer。
将AscendCloud代码包AscendCloud-xxx-xxx.zip上传到${workdir}目录下并解压缩，如：/home/ma-user/ws目录下，以下都以/home/ma-user/ws为例，请根据实际修改。
```
unzip AscendCloud-*.zip
unzip AscendCloud-LLM-*.zip  
```
上传tokenizers文件到工作目录中的/home/ma-user/ws/tokenizers/{Model_Name}目录，用户根据自己实际规划路径修改；如Qwen2-72B。
具体步骤如下：

进入到${workdir}目录下，如：/home/ma-user/ws，创建tokenizers文件目录将权重和词表文件放置此处，以Qwen2-72B为例。
```
cd /home/ma-user/ws
mkdir -p tokenizers/Qwen2-72B
```

父主题： 准备工作

上一篇：准备环境

下一篇：准备镜像环境

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

智能客服提问云社区提问

准备代码

获取模型软件包和权重文件

模型软件包结构说明

工作目录介绍

上传代码和权重文件到工作环境

相关文档

意见反馈

文档内容是否对您有帮助？

7*24

备案

专业服务

退订

建议反馈

售前咨询热线