准备代码

本教程中用到的模型软件包如下表所示，请提前准备好。

获取模型软件包

本方案支持的模型对应的软件和依赖包获取地址如表1所示。

表1 模型对应的软件包和依赖包获取地址
代码包名称	代码说明	下载地址
AscendCloud-6.3.912-xxx.zip 说明：软件包名称中的xxx表示时间戳。	包含了本教程中使用到的模型训练代码。代码包具体说明请参见模型软件包结构说明。	获取路径：Support-E，在此路径中查找下载ModelArts 6.3.912 版本。说明：如果上述软件获取路径打开后未显示相应的软件信息，说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。

模型软件包结构说明

AscendCloud-6.3.912代码包中AscendCloud-AIGC代码包结构介绍如下，训练脚本以分类的方式集中在scripts文件夹中：

AscendCloud-AIGC-6.3.912-xxx
├─aigc_inference
├─aigc_train
├─AscendCloud-Pytorch-Plugin
└─multimodal_algorithm
    ├─ascendcloud_multimodal_plugin
        ...
    ├─QwenVL                  
	├── train/<commit_id>     # 本教程中需要的模型代码
		            └── Dockerfile                     # 构建镜像
		            └── qwen-vl_install.sh             # 安装模型运行环境
		            └── qwen-vl.patch                  # 使用git apply修改模型相关代码

代码上传至OBS

代码包解压后，在OBS中创建mllm_train目录，并将train/<commit_id>上传至该目录中。

结合准备数据、准备权重、准备代码，将数据集、原始权重、代码文件都上传至OBS后，OBS桶的目录结构如下。

obs://standard-qwenvl-7b
├── training_data
│       └── qwenvl_dataset                    #数据集目录
│              ├── chart_qa_train_ocr.json       # json文件
│              └── new_single_bar                # 图片目录
│                       └── single_bar_1_1000.jpg
│	                 └── single_bar_1_1001.jpg
│	                 └── single_bar_1_1002.jpg
│	                 └── single_bar_1_1003.jpg
│                	        ...
├── mllm_train
│      └── train/<commit_id>                      # 本教程中需要的模型代码
│                └── Dockerfile                   # 构建镜像
│    	          └── qwen-vl_install.sh           # 安装模型运行环境
│	          └── qwen-vl.patch                # 使用git apply修改模型相关代码
│ 
└── models
        └── Qwen-VL-Chat

父主题： 准备工作

上一篇：准备权重

下一篇：将数据预热到SFS Turbo

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

盘古Doer提问云社区提问