模型能力地图
ModelArts支持如下开源模型基于昇腾NPU进行训练和推理。
GLM系列模型
| 支持模型 | 应用场景 | 软件技术栈 | 指导文档 |
|---|---|---|---|
| GLM5.1 | 推理 | Ascend-vLLM | |
| GLM5 | 推理 | Ascend-vLLM |
LLM大语言模型
ModelArts针对以下主流的LLM大模型进行了基于昇腾NPU的适配工作,可以直接使用适配过的模型在NPU上进行推理训练。
| 支持模型 | 支持模型参数量 | 应用场景 | 软件技术栈 | 指导文档 |
|---|---|---|---|---|
| Qwen2.5系列 | Qwen2.5-14B Qwen2.5-72B | 推理 | Ascend-vLLM | |
| Qwen3系列 | Qwen3-8B Qwen3-32B Qwen3-Embedding-0.6B Qwen3-Embedding-4B Qwen3-Embedding-8B Qwen3-Reranker-0.6B Qwen3-Reranker-4B Qwen3-Reranker-8B | 推理 | Ascend-vLLM | |
| bge系列 | bge-reranker-v2-m3 bge-large-en-v1.5 | 推理 | Ascend-vLLM |
| 支持模型 | 支持模型参数量 | 应用场景 | 指导文档 |
|---|---|---|---|
| DeepSeek系列 | DeepSeek-R1-671B DeepSeek-V3-671B DeepSeek-V2-Lite 16B | 预训练、微调 | |
| Llama系列 | Llama3.1 -8B/70B Llama3.2 -1B/3B | 预训练、微调 | |
| Qwen2系列 | Qwen2-0.5B Qwen2-1.5B Qwen2-7B Qwen2-72B | 预训练、微调 | |
| Qwen2.5系列 | Qwen2.5-0.5B Qwen2.5-1.5B Qwen2.5-7B Qwen2.5-14B Qwen2.5-32B Qwen2.5-72B | 预训练、微调 | |
| Qwen3系列 | Qwen3-0.6B Qwen3-1.7B Qwen3-4B Qwen3-8B Qwen3-14B Qwen3-32B Qwen3-30B-A3B Qwen3-235B-A22B | 预训练、微调 | |
| GLM-4 | GLM-4-9B-Chat | 预训练、微调 | |
| Mistral AI系列 | Mixtral-8x7B-Instruct-v0.1 | 预训练、微调 |
多模态模型
ModelArts针对以下主流的多模态模型进行了基于昇腾NPU的适配工作,可以直接使用适配过的模型在NPU上进行推理或训练。
| 支持模型 | 支持模型参数量 | 应用场景 | 软件技术栈 | 指导文档 |
|---|---|---|---|---|
| Qwen2.5-VL系列 | Qwen2.5-VL-7B Qwen2.5-VL-32B Qwen2.5-VL-72B | 推理 | Ascend-vLLM |
文本和语音生成模型
| 模型名称 | 应用场景 | 软件技术栈 | 指导文档 |
|---|---|---|---|
| Qwen3-Omni | 推理 | PyTorch |
图像生成模型
ModelArts针对以下主流的AIGC图像生成模型进行了基于昇腾NPU的适配工作,可以直接使用适配过的模型在NPU上进行推理或训练。
| 模型名称 | 应用场景 | 软件技术栈 | 指导文档 |
|---|---|---|---|
| Z-Image-Turbo | 推理 | PyTorch | |
| Qwen-Image Qwen-Image-Edit | Diffusers推理 ComfyUI推理 | PyTorch | |
| Stable Diffusion XL(SDXL) | Diffusers推理 ComfyUI推理 | PyTorch | |
| Stable Diffusion 1.5(SD1.5) | Diffusers推理 ComfyUI推理 | PyTorch | |
| Stable Diffusion 3.5(SD3.5) | Diffusers推理 ComfyUI推理 | PyTorch | |
| HUNYUAN | Diffusers推理 | PyTorch | |
| VAR/XAR/RandAR/Infinity自回归图像生成模型 | 推理 | PyTorch | |
| DeepSeek Janus-Pro | 推理 | PyTorch | DeepSeek Janus-Pro模型基于ModelArts Lite Server适配PyTorch NPU推理指导 |
| Open-clip | 训练 | PyTorch |
视频生成模型
| 模型名称 | 应用场景 | 软件技术栈 | 指导文档 |
|---|---|---|---|
| Wan系列 | 推理 训练 | PyTorch | |
| HunyuanVideo | 推理 | PyTorch | |
| CogVideo系列 | 推理 | PyTorch |
自动驾驶模型
| 模型名称 | 应用场景 | 软件技术栈 | 指导文档 |
|---|---|---|---|
| OpenEMMA | 推理 | PyTorch | |
| Senna | 训练 | PyTorch | |
| SparseDrive | 训练 | PyTorch | |
| UniAD | 训练 | PyTorch | |
| VAD | 训练 | PyTorch | |
| MapTRv2 | 训练 | PyTorch | |
| OpenVLA | 训练 | PyTorch | |
| PointPillar | 训练 | PyTorch | |
| Sparse4D | 训练 | PyTorch |