昇腾能力应用地图
ModelArts支持如下开源模型昇腾NPU进行训练和推理。
DeepSeek系列模型
支持模型 |
应用场景 |
软件技术栈 |
指导文档 |
---|---|---|---|
DeepSeek-R1-Distill系列模型 |
推理 |
Ascend-vLLM |
|
DeepSeek-R1 |
推理 |
Ascend-vLLM |
|
DeepSeek-V3/V3.1 |
推理 |
Ascend-vLLM |
LLM大语言模型
ModelArts针对以下主流的LLM大模型进行了基于昇腾NPU的适配工作,可以直接使用适配过的模型在NPU上进行推理训练。
支持模型 |
支持模型参数量 |
应用场景 |
软件技术栈 |
指导文档 |
---|---|---|---|---|
Llama2 |
Llama2-7b |
推理 |
Ascend-vLLM |
|
Llama3 |
Llama3-8b Llama3-70b |
推理 |
Ascend-vLLM |
|
Qwen2 |
qwen2-0.5b qwen2-1.5b qwen2-7b qwen2-72b qwen2-57b-a14b |
推理 |
Ascend-vLLM |
|
Qwen2.5 |
qwen2.5-0.5b qwen2.5-1.5b qwen2.5-3b qwen2.5-7b qwen2.5-14b qwen2.5-32b qwen2.5-72b |
推理 |
Ascend-vLLM |
|
GLMv4 |
glm4-9b |
推理 |
Ascend-vLLM |
|
llama3.1 |
llama3.1-8b llama3.1-70b llama-3.1-405B |
推理 |
Ascend-vLLM |
|
llama3.2 |
llama-3.2-1B llama-3.2-3B |
推理 |
Ascend-vLLM |
|
deepseek |
deepseek-v2-236b |
推理 |
Ascend-vLLM |
|
qwen-vl |
qwen-vl qwen-vl-chat |
推理 |
Ascend-vLLM |
|
MiniCPM-v2 |
MiniCPM-v2 |
推理 |
Ascend-vLLM |
|
gte-Qwen2-7B-instruct |
gte-Qwen2-7B-instruct |
推理 |
Ascend-vLLM |
支持模型 |
支持模型参数量 |
应用场景 |
软件技术栈 |
指导文档 |
---|---|---|---|---|
Llama2 |
Llama2-7b Llama2-13b Llama2-70b |
预训练、SFT全参微调、LoRA微调 |
MindSpeed-LLM(原名ModelLink) LLaMAFactory |
主流开源大模型基于ModelArts Lite Server适配AscendFactory PyTorch NPU训练指导 |
Llama3 |
Llama3-8b Llama3-70b |
预训练、SFT全参微调、LoRA微调 |
MindSpeed-LLM(原名ModelLink) LlamaFactory |
|
Qwen2 |
qwen2-0.5b qwen2-1.5b qwen2-7b qwen2-72b |
预训练、SFT全参微调、LoRA微调 |
MindSpeed-LLM(原名ModelLink) LlamaFactory |
|
Qwen2.5 |
qwen2.5-0.5b qwen2.5-7b qwen2.5-14b qwen2.5-32b qwen2.5-72b |
预训练、SFT全参微调、LoRA微调 |
MindSpeed-LLM(原名ModelLink) |
|
GLMv4 |
glm4-9b |
预训练、SFT全参微调、LoRA微调 |
MindSpeed-LLM(原名ModelLink) LlamaFactory |
|
llama3.1 |
llama3.1-8b llama3.1-70b |
预训练、SFT全参微调、LoRA微调 |
MindSpeed-LLM(原名ModelLink) LlamaFactory |
|
llama3.2 |
llama3.2-1b llama3.2-3b |
预训练、SFT全参微调、LoRA微调 |
MindSpeed-LLM(原名ModelLink) LlamaFactory |
|
Qwen2_VL |
qwen2_vl-2b qwen2_vl-7b qwen2_vl-72b |
预训练、SFT全参微调、LoRA微调 |
LlamaFactory |
多模态模型
ModelArts针对以下主流的多模态模型进行了基于昇腾NPU的适配工作,可以直接使用适配过的模型在NPU上进行推理或训练。
支持模型 |
支持模型参数量 |
应用场景 |
软件技术栈 |
指导文档 |
---|---|---|---|---|
internVL2 |
internVL2-Llama3-76B |
推理 |
Ascend-vLLM |
|
MiniCPM |
MiniCPM-v2.6 |
推理 |
Ascend-vLLM |
|
Qwen2-vl |
qwen2-vl-2B qwen2-vl-7B qwen2-vl-72B |
推理 |
Ascend-vLLM |
|
llava |
llava-v1.6-7b llava-v1.6-13b llava-v1.6-34b |
推理 |
Ascend-vLLM |
|
llava-onevision-qwen2 |
llava-onevision-qwen2-0.5b-ov-hf llava-onevision-qwen2-7b-ov-hf |
推理 |
Ascend-vLLM |
模型名称 |
应用场景 |
软件技术栈 |
指导文档 |
---|---|---|---|
MiniCPM-V2.6 |
训练 |
PyTorch |
|
MiniCPM-V2.0 |
训练 推理 |
PyTorch |
|
InternVL2 |
训练 |
PyTorch |
|
LLaVA-NeXT |
训练 |
PyTorch |
|
LLama 3.2-Vision |
训练 |
PyTorch |
|
LLaMA-VID |
推理 |
PyTorch |
|
moondream2 |
推理 |
PyTorch |
图像生成模型
ModelArts针对以下主流的AIGC文生图模型进行了基于昇腾NPU的适配工作,可以直接使用适配过的模型在NPU上进行推理或训练。
模型名称 |
应用场景 |
软件技术栈 |
指导文档 |
---|---|---|---|
Stable Diffusion XL(SDXL) |
Diffusers推理 ComfyUI推理 |
PyTorch |
Diffusers、ComfyUI套件基于ModelArts Lite Server适配PyTorch NPU的推理指导(6.5.906) |
Stable Diffusion 1.5(SD1.5) |
Diffusers推理 ComfyUI推理 |
PyTorch |
|
Stable Diffusion 3.5(SD3.5) |
Diffusers推理 ComfyUI推理 |
PyTorch |
|
HUNYUAN |
Diffusers推理 ComfyUI推理 |
PyTorch |
|
VAR/XAR/RandAR/Infinity自回归图像生成模型 |
推理 |
PyTorch |
VAR/XAR/RandAR/Infinity自回归图像生成模型基于Lite Server适配NPU推理指导(6.5.905) |
DeepSeek Janus-Pro |
推理 |
PyTorch |
DeepSeek Janus-Pro模型基于ModelArts Lite Server适配PyTorch NPU推理指导(6.5.902) |
Open-clip |
训练 |
PyTorch |
视频生成模型
模型名称 |
应用场景 |
软件技术栈 |
指导文档 |
---|---|---|---|
Wan2.1系列 |
推理 训练 |
PyTorch |
|
HunyuanVideo |
推理 |
PyTorch |
|
Cogvideo |
推理 |
PyTorch |
|
CogVideoX1.5 5b |
推理 训练 |
PyTorch |
|
CogVideoX 5b |
推理 |
PyTorch |
内容审核模型
模型名称 |
应用场景 |
软件技术栈 |
指导文档 |
---|---|---|---|
Bert |
推理 |
MindSpore Lite |
|
Yolov8 |
推理 |
MindSpore Lite |
|
Paraformer |
推理 |
PyTorch |
自动驾驶模型
模型名称 |
应用场景 |
软件技术栈 |
指导文档 |
---|---|---|---|
OpenEMMA |
推理 |
PyTorch |
|
Senna |
训练 |
PyTorch |
|
SparseDrive |
训练 |
PyTorch |
|
UniAD |
训练 |
PyTorch |
|
VAD |
训练 |
PyTorch |
|
MapTRv2 |
训练 |
PyTorch |
|
OpenVLA |
训练 |
PyTorch |
|
PointPillar |
训练 |
PyTorch |
|
Sparse4D |
训练 |
PyTorch |