文档首页/
AI开发平台ModelArts/
最佳实践/
MLLM多模态模型训练推理/
Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导(6.3.912)/
准备工作/
准备权重
更新时间:2025-07-29 GMT+08:00
准备权重
- 获取对应模型的权重文件,获取链接参考表1。
权重文件下载有如下几种方式,但不仅限于以下方式:
- 方法一:网页下载:通过单击表格中权重文件获取地址的访问链接,即可在模型主页的Files and Version中下载文件。
- 方法二:huggingface-cli:huggingface-cli是 Hugging Face 官方提供的命令行工具,自带完善的下载功能。具体步骤可参考:HF-Mirror中的使用教程。完成依赖安装和环境变量配置后,以Qwen/Qwen-VL-Chat为例:
huggingface-cli download --resume-download Qwen/Qwen-VL-Chat --local-dir <模型下载路径>
如果要下载指定版本的模型文件,则命令如下:
huggingface-cli download --resume-download Qwen/Qwen-VL-Chat --revision <模型版本> --local-dir <模型下载路径>
- 方法三:使用专用多线程下载器 hfd:hfd 是本站开发的 huggingface 专用下载工具,基于成熟工具 git+aria2,可以做到稳定下载不断线。
- 方法四:使用Git clone,官方提供了 git clone repo_url 的方式下载,但是不支持断点续传,并且clone 会下载历史版本占用磁盘空间。
- 在创建OBS桶创建的桶下创建文件夹用以存放权重和词表文件,例如在桶standard-qwenvl-7b中创建文件夹models。
- 参考文档利用OBS-Browser-Plus工具将步骤1下载的权重文件上传至步骤2创建的文件夹目录下。得到OBS下数据集结构,此处以Qwen/Qwen-VL-Chat为例:
obs://<bucket_name>/models/Qwen-VL-Chat/ ├── config.json ├── configuration_qwen.py ├── generation_config.json ├── modeling_qwen.py # 需要修改代码 ├── pytorch_model-00001-of-00010.bin ├── pytorch_model-00002-of-00010.bin ├── pytorch_model-00003-of-00010.bin ├── pytorch_model-00004-of-00010.bin ├── pytorch_model-00005-of-00010.bin ├── pytorch_model-00006-of-00010.bin ├── pytorch_model-00007-of-00010.bin ├── pytorch_model-00008-of-00010.bin ├── pytorch_model-00009-of-00010.bin ├── pytorch_model-00010-of-00010.bin ├── pytorch_model.bin.index.json ├── qwen_generation_utils.py ├── qwen.tiktoken ├── README.md ├── tokenization_qwen.py # 需要修改代码 ├── SimSun.ttf # 需要手动下载 ├── tokenizer_config.json └── visual.py
- 对于Qwen-VL模型,还需要手动修改训练参数和tokenizer文件,具体请参见训练tokenizer文件说明。
父主题: 准备工作