模型训练类型说明
当前 ModelArts Studio 通过预置镜像支持的三方模型训练方式支持情况如下。
模型名称 |
预训练 |
微调 |
LoRA |
强化学习 |
---|---|---|---|---|
DeepSeek-R1-distill-Qwen-32B |
支持 16训练单元-8K |
支持 16训练单元-8K |
支持 8训练单元-8K |
不支持 |
DeepSeek-R1-distill-LLama-70B |
支持 32训练单元-8K |
支持 32训练单元-8K |
支持 8训练单元-8K |
不支持 |
DeepSeek-R1-distill-LLama-8B |
支持 8训练单元-8K |
支持 8训练单元-8K |
支持 8训练单元-8K |
不支持 |
Qwen3-235B-A22B |
不支持 |
支持 256训练单元-4K |
支持 32训练单元-4K |
不支持 |
Qwen3-32B |
不支持 |
支持 16训练单元-4K |
支持 8训练单元-4K |
不支持 |
Qwen3-30B-A3B |
不支持 |
支持 16训练单元-4K |
支持 8训练单元-4K |
不支持 |
Qwen3-14B |
不支持 |
支持 8训练单元-4K |
支持 4训练单元-4K |
不支持 |
Qwen3-8B |
不支持 |
支持 8训练单元-4K |
支持 4训练单元-4K |
不支持 |
Qwen2.5-72B |
不支持 |
支持 32训练单元-4K |
支持 32训练单元-4K |
不支持 |
QWQ-32B |
不支持 |
不支持 |
不支持 |
不支持 |