准备代码

本教程中用到的模型软件包如下表所示，请提前准备好。

获取模型软件包

本方案支持的模型对应的软件和依赖包获取地址如表1所示。

表1 模型对应的软件包和依赖包获取地址
代码包名称	代码说明	下载地址
AscendCloud-6.5.901-xxx.zip 说明：软件包名称中的xxx表示时间戳。	包含了本教程中使用到的模型训练代码。代码包具体说明请参见模型软件包结构说明。	获取路径：Support-E，在此路径中查找下载ModelArts 6.5.901 版本。说明：如果上述软件获取路径打开后未显示相应的软件信息，说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。

模型软件包结构说明

AscendCloud-6.5.901代码包中AscendCloud-LLM代码包结构如下：

|——AscendCloud-LLM
  |──llm_train                    # 模型训练代码包
    |──AscendFactory   
      |──examples/config          # config配置文件目录
        |──modellink_performance_cfgs.yaml # modellink配置最优参数yaml文件
      |──data.tgz                 # 样例数据压缩包
      |──third-party/             # 三方依赖的代码仓，和补丁patch包
      |──src/acs_train_solution/  # 训练运行包
      |──intall.sh                # 安装脚本
      |——dependences.yaml         # 需要的三方依赖包的版本和下载地址
      |──scripts_llamafactory/    # llamafactory兼容旧版本启动方式目录
      |──scripts_modellink/       # modelLink兼容旧版本启动方式目录
      |──Dockerfile

AscendFactory/examples/config配置文件目录：

|──AscendFactory/examples/config/  # config配置文件
   |──modellink_performance_cfgs.yaml # modellink配置最优参数yaml文件
   |──performance_cfgs.yaml        # 微调性能配置yaml文件
   |──llama_factory_performance_cfgs_VL.yaml  # qwen2vl微调yaml配置文件
   |──accuracy_cfgs.yaml           # 训练精度配置yaml文件
   |──llama_factory_cfgs_posttrain.yaml  # RM、PPO、DPO训练阶段样例yaml文件
   |──llama_factory_performance_baseline.yaml # 性能基线配置
   |──llama_factory_accuracy_baseline.yaml    # 精度基线配置

该目录下主要放置性能、精度任务的yaml配置文件，包含性能基线、精度基线、训练最佳实践参数等，以上配置文件仅供参考。

代码上传至OBS

本地完成代码包AscendCloud-LLM-xxx.zip的解压，将llm_train文件上传至OBS中。

结合准备数据、准备权重、准备代码，将数据集、原始权重、代码文件都上传至OBS后，OBS桶的目录结构如下。

<bucket_name>
|──llm_train                       # 模型训练代码包
    |──AscendFactory               
|──model/Qwen2-7B/                 # 权重词表文件目录，如Qwen2-7B
|──training_data                   # 原始数据目录         
# 训练输出目录路径：根据{OUTPUT_SAVE_DIR}或yaml文件{output_dir}参数设置
|──{output_dir}                    # 输出目录，以下目录在训练过程中自动生成
    |──converted_hf2mg_weight_TP${TP}PP${PP} # 训练过程Megatron格式权重
    |──converted_mg2hf_weight   # 训练完成转换为HF格式权重目录，
    |──logs                     # 训练过程日志
    |──preprocessed_data        # 训练过程预处理后数据集目录
    |──saved_checkpoints        # 训练生成权重文件

Yi-34B、Qwen1.5系列、GLM4-9B模型执行lora微调策略任务如产生mc2融合算子错误，可参考mc2融合算子报错

父主题： 准备工作

上一篇：准备权重

下一篇：准备镜像

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

盘古Doer提问云社区提问