文档首页/ AI开发平台ModelArts/ 最佳实践/ MLLM多模态模型训练推理/ Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912）/ 训练脚本说明/ 不同模型推荐的参数与NPU卡数设置

更新时间：2025-01-18 GMT+08:00

查看PDF

不同模型推荐的参数与NPU卡数设置

表1 不同模型推荐的参数与NPU卡数设置
模型	Template	模型参数量	训练策略类型	序列长度cutoff_len	梯度累积值	优化工具 (Deepspeed)	规格与节点数
Qwen-VL	Qwen-VL	7B	full	2048	gradient_accumulation_steps: 16	ZeRO-3	1节点 & 8Ascend
Qwen-VL	Qwen-VL	7B	lora	2048	gradient_accumulation_steps: 8	ZeRO-2	1节点 & 8Ascend

父主题： 训练脚本说明

上一篇：训练脚本存放目录说明

下一篇：训练tokenizer文件说明

相关文档

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

盘古Doer提问云社区提问