准备代码

本教程中用到的模型软件包如下表所示，请提前准备好。

获取模型软件包

本方案支持的模型对应的软件和依赖包获取地址如表1所示。

表1 模型对应的软件包和依赖包获取地址
代码包名称	代码说明	下载地址
AscendCloud-6.3.906-xxx.zip 说明：软件包名称中的xxx表示时间戳。	包含了本教程中使用到的模型训练代码。代码包具体说明请参见模型软件包结构说明。	获取路径：Support-E 请联系您所在企业的华为方技术支持下载获取。

模型软件包结构说明

AscendCloud-6.3.906代码包中AscendCloud-LLM代码包结构介绍如下，训练脚本以分类的方式集中在scripts文件夹中：

|──llm_train                 # 模型训练代码包
          |──AscendSpeed         # 基于AscendSpeed的训练代码
                 |──ascendcloud_patch/   # 针对昇腾云平台适配的功能补丁包
                 |──scripts/             # 训练需要的启动脚本
                      |──llama2          # llama2系列模型执行脚本的文件夹
                      |──llama3          # llama3系列模型执行脚本的文件夹
                      |──qwen            # Qwen系列模型执行脚本的文件夹
                      |──qwen1.5         # Qwen1.5系列模型执行脚本的文件夹
                      |── ...
                      |── dev_pipeline.sh  # 系列模型共同调用的多功能的脚本
                      |── install.sh       # 环境部署脚本
                 |——src/                 # 启动命令行封装脚本，在install.sh里面自动构建
|──llm_inference                 # 推理代码包
|──llm_tools                     # 推理工具

代码上传至OBS

将AscendSpeed代码包AscendCloud-LLM-xxx.zip在本地解压缩后，将llm_train文件上传至OBS中。

结合准备数据、准备权重、准备代码，将数据集、原始权重、代码文件都上传至OBS后，OBS桶的目录结构如下。

<bucket_name>
|──llm_train                       # 解压代码包后自动生成的代码目录，无需用户创建
      |── AscendSpeed              # 代码目录
              |──ascendcloud_patch/   # 针对昇腾云平台适配的功能代码包
              |──scripts/             # 训练需要的启动脚本
      # 自动生成数据目录结构
      |── processed_for_input           #目录结构会自动生成，无需用户创建
              |── ${model_name}             # 模型名称
                     |── data              # 预处理后数据
		          |── pretrain   # 预训练加载的数据
		          |── finetune   # 微调加载的数据
	      |──converted_weights  # HuggingFace格式转换megatron格式后权重文件
      |── saved_dir_for_output            # 训练输出保存权重，目录结构会自动生成，无需用户创建
              |── ${model_name}             # 模型名称
	                  |── logs              # 训练过程中日志（loss、吞吐性能）
                          |—— saved_models    
		               |── lora              # lora微调输出权重
		               |── sft               # 增量训练输出权重
		               |── pretrain          # 预训练输出权重
# 以下目录结构，用户自己创建
|── training_data                                           #原始数据目录，需要用户手动创建并上传，后续操作步骤中会提示
      ├── train-00000-of-00001-a09b74b3ef9c3b56.parquet    #预训练时预处理后的数据存放地址
      ├── alpaca_gpt4_data.json                            #微调数据文件
|── tokenizer                      #tokenizer目录，需要用户手动创建，后续操作步骤中会提示
      |── llama2-13B-chat-hf
|── model                          #原始权重与tokenizer目录，需要用户手动创建，后续操作步骤中会提示
      |── llama2-13B-chat-hf

父主题： 准备工作

上一篇：准备权重

下一篇：准备镜像

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

智能客服提问云社区提问

准备代码

获取模型软件包

模型软件包结构说明

代码上传至OBS

相关文档

意见反馈

文档内容是否对您有帮助？

7*24

备案

专业服务

退订

建议反馈

售前咨询热线