更新时间:2026-03-30 GMT+08:00
分享

模型能力地图

ModelArts支持如下开源模型基于昇腾NPU进行训练和推理。

LLM大语言模型

ModelArts针对以下主流的LLM大模型进行了基于昇腾NPU的适配工作,可以直接使用适配过的模型在NPU上进行推理训练。

表1 LLM模型推理能力

支持模型

支持模型参数量

应用场景

软件技术栈

指导文档

Qwen2.5系列

Qwen2.5-14B

Qwen2.5-72B

推理

Ascend-vLLM

LLM大语言模型推理

Qwen3系列

Qwen3-8B

Qwen3-32B

Qwen3-235B-A22B-Thinking-2507

Qwen3-Embedding-0.6B

Qwen3-Embedding-4B

Qwen3-Embedding-8B

Qwen3-Reranker-0.6B

Qwen3-Reranker-4B

Qwen3-Reranker-8B

推理

Ascend-vLLM

bge系列

bge-reranker-v2-m3

bge-large-en-v1.5

推理

Ascend-vLLM

GLM

GLM5

推理

Ascend-vLLM

GLM-5模型推理部署

表2 LLM模型训练能力

支持模型

支持模型参数量

应用场景

指导文档

DeepSeek系列

DeepSeek-R1-671B

DeepSeek-V3-671B

DeepSeek-V2-Lite 16B

预训练、微调

LLM大语言模型训练

Llama系列

Llama3.1 -8B/70B

Llama3.2 -1B/3B

预训练、微调

Qwen2系列

Qwen2-0.5B

Qwen2-1.5B

Qwen2-7B

Qwen2-72B

预训练、微调

Qwen2.5系列

Qwen2.5-0.5B

Qwen2.5-1.5B

Qwen2.5-7B

Qwen2.5-14B

Qwen2.5-32B

Qwen2.5-72B

预训练、微调

Qwen3系列

Qwen3-0.6B

Qwen3-1.7B

Qwen3-4B

Qwen3-8B

Qwen3-14B

Qwen3-32B

Qwen3-30B-A3B

Qwen3-235B-A22B

预训练、微调

GLM-4

GLM-4-9B-Chat

预训练、微调

Mistral AI系列

Mixtral-8x7B-Instruct-v0.1

预训练、微调

多模态模型

ModelArts针对以下主流的多模态模型进行了基于昇腾NPU的适配工作,可以直接使用适配过的模型在NPU上进行推理或训练。

表3 多模态模型基于Ascend-vLLM框架的推理

支持模型

支持模型参数量

应用场景

软件技术栈

指导文档

Qwen2.5-VL系列

Qwen2.5-VL-7B

Qwen2.5-VL-32B

Qwen2.5-VL-72B

推理

Ascend-vLLM

LLM大语言模型推理

文本和语音生成模型

表4 视频生成模型

模型名称

应用场景

软件技术栈

指导文档

Qwen3-Omni

推理

PyTorch

文本和语音生成场景模型训练推理

图像生成模型

ModelArts针对以下主流的AIGC图像生成模型进行了基于昇腾NPU的适配工作,可以直接使用适配过的模型在NPU上进行推理或训练。

表5 文生图模型

模型名称

应用场景

软件技术栈

指导文档

Z-Image-Turbo

推理

PyTorch

Z-Image-Turbo模型基于ModelArts轻量算力节点适配NPU推理指导(6.5.912)

Qwen-Image

Qwen-Image-Edit

Diffusers推理

ComfyUI推理

PyTorch

Qwen-Image、Qwen-Image-Edit基于Lite Server适配NPU推理指导

Stable Diffusion XL(SDXL)

Diffusers推理

ComfyUI推理

PyTorch

SD系列模型对应Diffusers/ComfyUI框架基于Lite Server适配NPU推理指导

Stable Diffusion XL基于ModelArts Notebook的推理指导(6.5.907)

Stable Diffusion 1.5(SD1.5)

Diffusers推理

ComfyUI推理

PyTorch

Stable Diffusion 3.5(SD3.5)

Diffusers推理

ComfyUI推理

PyTorch

HUNYUAN

Diffusers推理

PyTorch

VAR/XAR/RandAR/Infinity自回归图像生成模型

推理

PyTorch

VAR/XAR/RandAR/Infinity自回归图像生成模型基于Lite Server适配NPU推理指导

DeepSeek Janus-Pro

推理

PyTorch

DeepSeek Janus-Pro模型基于ModelArts Lite Server适配PyTorch NPU推理指导

Open-clip

训练

PyTorch

Open-Clip基于轻量算力节点适配NPU训练指导

视频生成模型

表6 视频生成模型

模型名称

应用场景

软件技术栈

指导文档

Wan系列

推理

训练

PyTorch

视频生成模型训练推理

HunyuanVideo

推理

PyTorch

视频生成模型训练推理

CogVideo系列

推理

PyTorch

自动驾驶模型

表7 自动驾驶模型

模型名称

应用场景

软件技术栈

指导文档

OpenEMMA

推理

PyTorch

自动驾驶模型训练推理

Senna

训练

PyTorch

SparseDrive

训练

PyTorch

UniAD

训练

PyTorch

VAD

训练

PyTorch

MapTRv2

训练

PyTorch

OpenVLA

训练

PyTorch

PointPillar

训练

PyTorch

Sparse4D

训练

PyTorch

相关文档