准备权重

获取对应模型的权重文件，获取链接参考表1。
权重文件下载有如下几种方式，但不仅限于以下方式：
- 方法一：网页下载：通过单击表格中权重文件获取地址的访问链接，即可在模型主页的Files and Version中下载文件。
- 方法二：huggingface-cli：huggingface-cli是 Hugging Face 官方提供的命令行工具，自带完善的下载功能。具体步骤可参考：HF-Mirror中的使用教程。完成依赖安装和环境变量配置后，以Qwen/Qwen-VL-Chat为例：
```
huggingface-cli download --resume-download Qwen/Qwen-VL-Chat --local-dir <模型下载路径>
```
  如果要下载指定版本的模型文件，则命令如下：
```
huggingface-cli download --resume-download Qwen/Qwen-VL-Chat --revision <模型版本>  --local-dir <模型下载路径>
```
- 方法三：使用专用多线程下载器 hfd：hfd 是本站开发的 huggingface 专用下载工具，基于成熟工具 git+aria2，可以做到稳定下载不断线。
- 方法四：使用Git clone，官方提供了 git clone repo_url 的方式下载，但是不支持断点续传，并且clone 会下载历史版本占用磁盘空间。
在创建OBS桶创建的桶下创建文件夹用以存放权重和词表文件，例如在桶standard-qwenvl-7b中创建文件夹models。

参考文档利用OBS-Browser-Plus工具将步骤1下载的权重文件上传至步骤2创建的文件夹目录下。得到OBS下数据集结构，此处以Qwen/Qwen-VL-Chat为例：

obs://<bucket_name>/models/Qwen-VL-Chat/
├── config.json
├── configuration_qwen.py
├── generation_config.json
├── modeling_qwen.py   # 需要修改代码
├── pytorch_model-00001-of-00010.bin
├── pytorch_model-00002-of-00010.bin
├── pytorch_model-00003-of-00010.bin
├── pytorch_model-00004-of-00010.bin
├── pytorch_model-00005-of-00010.bin
├── pytorch_model-00006-of-00010.bin
├── pytorch_model-00007-of-00010.bin
├── pytorch_model-00008-of-00010.bin
├── pytorch_model-00009-of-00010.bin
├── pytorch_model-00010-of-00010.bin
├── pytorch_model.bin.index.json
├── qwen_generation_utils.py
├── qwen.tiktoken
├── README.md
├── tokenization_qwen.py  # 需要修改代码
├── SimSun.ttf            # 需要手动下载
├── tokenizer_config.json
└── visual.py

对于Qwen-VL模型，还需要手动修改训练参数和tokenizer文件，具体请参见训练tokenizer文件说明。

父主题： 准备工作

上一篇：准备数据

下一篇：准备代码

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

盘古Doer提问云社区提问

准备权重

相关文档

意见反馈

文档内容是否对您有帮助？