昇腾能力应用地图
ModelArts支持如下开源模型基于Ascend卡进行训练和推理。
主流三方大模型
ModelArts针对以下主流的LLM大模型进行了基于昇腾NPU的适配工作,可以直接使用适配过的模型进行推理训练。
支持模型 |
支持模型参数量 |
应用场景 |
软件技术栈 |
指导文档 |
---|---|---|---|---|
Llama2 |
Llama2-7b Llama2-13b Llama2-70b |
预训练、SFT全参微调、LoRA微调 |
ModelLink LLaMAFactory |
|
Llama3 |
Llama3-8b Llama3-70b |
预训练、SFT全参微调、LoRA微调 |
ModelLink LlamaFactory |
|
Qwen |
qwen-7b qwen-14b qwen-72b |
预训练、SFT全参微调、LoRA微调 |
ModelLink LlamaFactory |
|
Qwen1.5 |
qwen1.5-7b qwen1.5-14b qwen1.5-32b qwen1.5-72b |
预训练、SFT全参微调、LoRA微调 |
ModelLink LlamaFactory |
|
Qwen2 |
qwen2-0.5b qwen2-1.5b qwen2-7b qwen2-72b |
预训练、SFT全参微调、LoRA微调 |
ModelLink LlamaFactory |
|
Yi |
yi-6b yi-34b |
预训练、SFT全参微调、LoRA微调 |
ModelLink LlamaFactory |
|
ChatGLMv3 |
glm3-6b |
预训练、SFT全参微调、LoRA微调 |
ModelLink LlamaFactory |
|
GLMv4 |
glm4-9b |
预训练、SFT全参微调、LoRA微调 |
ModelLink LlamaFactory |
|
Baichuan2 |
baichuan2-13b |
预训练、SFT全参微调、LoRA微调 |
ModelLink LlamaFactory |
支持模型 |
支持模型参数量 |
应用场景 |
软件技术栈 |
指导文档 |
---|---|---|---|---|
Llama |
Llama-7b Llama-13b Llama-65b |
推理 |
Ascend-vLLM |
|
Llama2 |
Llama2-7b Llama2-13b Llama2-70b |
推理 |
Ascend-vLLM |
|
Llama3 |
Llama3-8b Llama3-70b |
推理 |
Ascend-vLLM |
|
Yi |
yi-6b yi-9b yi-34b |
推理 |
Ascend-vLLM |
|
deepseek |
deepseek-llm-7b deepseek-llm-67b deepseek-coder-instruct-33b |
推理 |
Ascend-vLLM |
|
Qwen |
qwen-7b qwen-14b qwen-72b |
推理 |
Ascend-vLLM |
|
Qwen1.5 |
qwen1.5-0.5b qwen1.5-7b qwen1.5-1.8b qwen1.5-14b qwen1.5-32b qwen1.5-72b qwen1.5-110b |
推理 |
Ascend-vLLM |
|
Qwen2 |
qwen2-0.5b qwen2-1.5b qwen2-7b qwen2-72b |
推理 |
Ascend-vLLM |
|
Baichuan2 |
baichuan2-7b baichuan2-13b |
推理 |
Ascend-vLLM |
|
gemma |
gemma-2b gemma-7b |
推理 |
Ascend-vLLM |
|
ChatGLM2 |
chatglm2-6b |
推理 |
Ascend-vLLM |
|
ChatGLM4 |
chatglm3-6b |
推理 |
Ascend-vLLM |
|
GLMv4 |
glm4-9b |
推理 |
Ascend-vLLM |
|
mistral |
mistral-7b mistral-8x7b |
推理 |
Ascend-vLLM |
AIGC模型
ModelArts针对以下主流的AIGC模型进行了基于昇腾NPU的适配工作,可以直接使用适配过的模型进行推理训练。
模型名称 |
应用场景 |
软件技术栈 |
指导文档 |
---|---|---|---|
Stable Diffusion 1.5 Stable Diffusion XL Stable Diffusion 3 |
SFT全量微调训练 LoRA微调训练 |
Diffusers训练、Kohya训练、PyTorch |
SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU推理指导(6.3.908) |
WebUI推理 |
WebUI推理、PyTorch |
||
Open-Sora-Plan |
训练 推理 |
PyTorch |
|
Qwen-VL |
训练 推理 |
PyTorch |
|
LLaVA |
训练 推理 |
PyTorch |
|
Open-clip |
训练 推理 |
PyTorch |
模型名称 |
应用场景 |
软件技术栈 |
指导文档 |
---|---|---|---|
Wav2Lip |
训练 |
PyTorch |
|
推理 |
PyTorch |