更新时间:2025-10-22 GMT+08:00
分享

各训练框架支持的模型和特性

LlamaFactory支持的模型和关键特性

表1 LlamaFactory支持的模型和关键特性

模型类型

模型系列

模型名称

LlamaFactory

训练方法(PTSFTDPO

长序列并行

(Ring Attention、Ulysses)

序列长度(NA表示32k以上未在正式版本中经过测试)

DeepSeed ZeRo并行

FlashAttention

LLM

DeepSeek系列

DeepSeek-R1-671B

NA

DeepSeek-V3-671B

NA

DeepSeek-V2-Lite 16B

NA

Qwen2系列

Qwen2-0.5B

PT、SFT

NA

Qwen2-1.5B

NA

Qwen2-7B

PT、SFT

NA

Qwen2-72B

PT、SFT

NA

Qwen2.5系列

Qwen2.5-0.5B

PT、SFT

NA

Qwen2.5-1.5B

NA

Qwen2.5-7B

PT、SFT

NA

Qwen2.5-14B

PT、SFT、DPO

NA

Qwen2.5-32B

PT、SFT

NA

Qwen2.5-72B

PT、SFT、DPO

NA

Qwen3系列

Qwen3-0.6B

PT、SFT

NA

Qwen3-1.7B

PT、SFT

NA

Qwen3-4B

PT、SFT

NA

Qwen3-8B

PT、SFT

Full SFT:32k

Qwen3-14B

PT、SFT

NA

Qwen3-32B

PT、SFT

NA

Qwen3-30B-A3B

PT、SFT

NA

Qwen3-235b-A22B

PT、SFT

NA

Llama系列

Llama3.1 -8B/70B

PT、SFT

NA

Llama3.2 -1B/3B

PT、SFT

NA

glm系列

glm-4-9b-chat

PT、SFT

NA

Mixtral系列

Mixtral-8x7B-Instruct-v0.1

NA

多模态

Qwen2 VL系列

Qwen2-VL-2B

PT、SFT

NA

Qwen2-VL-7B

PT、SFT

NA

Qwen2-VL-72B

PT、SFT

NA

Qwen2.5 VL系列

Qwen2.5-VL-3B

PT、SFT

NA

Qwen2.5-VL-7B

PT、SFT、DPO

Full SFT:32k

Qwen2.5-VL-32B

PT、SFT

Full SFT:32k

Qwen2.5-VL-72B

PT、SFT

NA

Gemma系列

Gemma3-27b

PT、SFT

NA

MindSpeed-LLM支持的模型和关键特性

表2 MindSpeed-LLM支持的模型和关键特性

模型类型

模型系列

模型名称

MindSpeed-LLM

PT、full微调

LoRA微调

多样本pack微调

Flash attention

SPTD并行

张量并行流水线并行虚拟流水并行序列并行

长序列并行

Ascend Ring Attention 长序列并行Ulysses 长序列并行混合长序列并行

序列长度(NA表示32k以上未在正式版本中经过测试)

MOE并行

MOE 专家并行MOE 重排通信优化

LLM

DeepSeek系列

DeepSeek-R1-671B

NA

DeepSeek-V3-671B

NA

DeepSeek-V2-Lite 16B

NA

Qwen2

系列

Qwen2-0.5B

NA

Qwen2-1.5B

NA

Qwen2-7B

NA

Qwen2-72B

NA

Qwen2.5

系列

Qwen2.5-0.5B

32k

Qwen2.5-1.5B

32k

Qwen2.5-7B

32k

Qwen2.5-14B

32k

Qwen2.5-32B

32k

Qwen2.5-72B

32k

Qwen3系列

Qwen3-0.6B

32k

Qwen3-1.7B

32k

Qwen3-4B

32k

Qwen3-8B

NA

Qwen3-14B

32k

Qwen3-32B

32k

Qwen3-30B-A3B

32k

Qwen3-235b-A22B

NA

Llama系列

Llama3.1 -8B/70B

NA

Llama3.2 -1B/3B

NA

glm系列

glm-4-9b-chat

NA

Mixtral系列

Mixtral-8x7B-Instruct-v0.1

NA

VeRL支持的模型和关键特性

表3 VeRL支持的模型和关键特性

模型类型

模型系列

模型名称

VeRL

强化学习算法

GRPODAPOPPO

sglang推理后端

vllm推理后端版本

训练后端

FSDPMegatron-LM

序列长度(NA表示32k以上未在正式版本中经过测试)

LLM

Qwen2.5系列

Qwen2.5-7B

GRPO

0.9.1

FSDP

NA

Qwen2.5-32B

GRPO、DAPO、PPO

0.9.1

FSDP

NA

Qwen2.5-72B

GRPO、DAPO

0.9.1

FSDP、Megatron-LM

32k

Qwen3系列

Qwen3-8B

GRPO

0.9.1

FSDP、Megatron-LM

32k

Qwen3-14B

GRPO、DAPO、PPO

0.9.1

FSDP

NA

Qwen3-32B

GRPO、DAPO、PPO

0.9.1

FSDP、Megatron-LM

32k

Qwen3-30B-A3B

GRPO、DAPO

0.9.1

Megatron-LM

32k

多模态

Qwen2.5 VL系列

Qwen2.5-VL-3B

GRPO

0.9.1

FSDP

NA

Qwen2.5-VL-7B

GRPO、DAPO、PPO

0.9.1

FSDP

32k

Qwen2.5-VL-32B

GRPO、DAPO、PPO

0.9.1

FSDP

NA

Qwen2.5-VL-72B

GRPO、DAPO

0.9.1

FSDP

NA

MindSpeed-RL支持的模型和关键特性

表4 MindSpeed-RL支持的模型和关键特性

模型类型

模型系列

模型名称

MindSpeed-RL

强化学习算法

GRPODAPOPPO

vllm推理后端版本

训练后端Megatron

长序列并行

LLM

Qwen2.5系列

Qwen2.5-1.5B

GRPO

0.9.1

Qwen2.5-7B

GRPO

0.9.1

Qwen2.5-32B

GRPO

0.9.1

Qwen3系列

Qwen3-32B

GRPO

0.9.1

Qwen3-30B-A3B

GRPO

0.9.1

多模态

Qwen2.5 VL系列

Qwen2.5-VL-3B

GRPO

0.9.1

Qwen2.5-VL-7B

GRPO

0.9.1

MindSpeed-MM支持的模型和关键特性

表5 MindSpeed-MM支持的模型和关键特性

模型类型

模型系列

模型名称

MindSpeed-MM

并行优化

TPTP-SPVPPPPCP

Megatron 分布式优化器

Megatron重计算

训练方法

(PT、SFT)

LoRA微调

多模态

Qwen2.5 VL系列

Qwen2.5-VL-7B

TP、TP-SP、PP、CP

PT、full微调

相关文档