更新时间:2026-05-23 GMT+08:00
分享

ModelArts最佳实践案例列表

在最佳实践文档中,提供了针对多种场景、多种AI引擎的ModelArts案例,方便您通过如下案例快速了解使用ModelArts完成AI开发的流程和操作。

本文档中提供的所有实践案例,仅适用于功能验证、原型测试等场景。鉴于生产环境对高可用、安全合规、可观测性及运维管控的严苛要求,请勿直接将本文档中的案例用于业务生产环境。

DeepSeek系列模型推理场景

样例

场景

说明

推理入门:一键完成DeepSeek-V4-Flash模型部署

推理

介绍DeepSeek-V4-Flash模型基于ModelArts推理平台一键部署指导,使用简单方便,易上手。

GLM-5系列模型推理场景

样例

场景

说明

推理入门:一键完成GLM-5.1模型部署

推理

介绍GLM-5.1模型基于ModelArts推理平台一键部署指导,使用简单方便,易上手。

推理入门:一键完成GLM-5模型部署

推理

介绍GLM-5模型基于ModelArts推理平台一键部署指导,使用简单方便,易上手。

GLM-5模型基于ModelArts轻量算力节点适配NPU推理指导

推理

介绍GLM-5模型基于ModelArts 轻量算力节点部署推理服务的操作过程。

LLM大语言模型训练推理场景

样例

场景

说明

Qwen3&Qwen3-VL系列模型基于ModelArts平台适配VeOmni框架训练指导

Qwen3系列模型基于ModelArts平台适配MindSpeed-LLM框架训练指导

Qwen3&Qwen2.5-VL模型基于ModelArts平台适配VeRL框架训练指导

Qwen3系列模型基于ModelArts平台适配AreaL框架训练指导

预训练、SFT全参微调训练、LoRA微调训练

介绍Qwen3、Qwen2.5-VL系列等模型适配各类框架,基于ModelArts的训练过程,训练使用昇腾NPU计算资源。

主流开源大模型适配Ascend-vLLM PyTorch NPU推理指导

推理部署、推理性能测试、推理精度测试、推理模型量化

介绍主流的开源大模型Llama系列、Qwen3系列、Qwen-VL系列等模型基于ModelArts的推理部署过程,推理使用Ascend-vLLM框架和昇腾NPU计算资源。

多模态模型场景

样例

场景

说明

moondream2基于轻量算力节点适配PyTorch NPU推理指导

Bunny-Llama-3-8B-V、InternVL2、LLaVA-NeXT、LLaVA、Llama 3.2-Vision、moondream2等模型的训练或推理

介绍常见多模态模型使用ModelArts训练或推理过程。

图像生成模型训练推理场景

样例

场景

说明

Diffusers、ComfyUI套件基于ModelArts Lite Server适配PyTorch NPU的推理指导

VAR/XAR/RandAR/Infinity自回归图像生成模型基于Lite Server适配NPU推理指导

DeepSeek Janus-Pro模型基于ModelArts Lite Server适配PyTorch NPU推理指导

SD1.5、SDXL、SD3.5、HUNYUAN模型推理

VAR/XAR/RandAR/Infinity、DeepSeek Janus-Pro模型推理

介绍常见的图像生成模型基于ModelArts Lite Server的推理过程,推理使用昇腾NPU计算资源。

启动推理服务后,可应用于图像生成场景。

Stable Diffusion XL基于ModelArts Notebook的推理指导(6.5.907)

SDXL模型推理

介绍常见的图像生成模型基于Notebook的推理过程,推理使用昇腾NPU计算资源。

启动推理服务后,可应用于图像生成场景。

Open-Clip基于轻量算力节点适配NPU训练指导

Open-Clip模型训练

介绍Open-Clip模型基于ModelArts轻量算力节点的训练过程,训练使用PyTorch框架和昇腾NPU计算资源。

应用于AIGC和多模态视频编码器。

视频生成模型训练推理场景

样例

场景

说明

Wan2.1/Wan2.2/HunyuanVideo/CogVideo系列模型基于ModelArts Lite Server适配NPU推理指导

Wan系列模型推理

介绍Wan系列模型基于ModelArts轻量算力节点的推理过程,推理使用PyTorch框架和昇腾NPU计算资源。

Wan2.1系列文/图生视频模型基于ModelArts Lite Server适配NPU训练指导

Wan系列模型训练

介绍Wan系列模型基于ModelArts轻量算力节点的训练过程,训练使用PyTorch框架和昇腾NPU计算资源。

训练后的模型可用于推理部署,应用于视频生成场景。

ModelArts开发环境案例

表1 Notebook样例列表

样例

对应功能

场景

说明

将Notebook的Conda环境迁移到SFS磁盘

环境迁移

开发环境

本案例介绍如何将Notebook的Conda环境迁移到SFS磁盘上。

使用ModelArts VSCode插件调试训练ResNet50图像分类模型

VS Code Toolkit工具

目标检测

本案例以Ascend Model Zoo为例,介绍如何通过VS Code插件及ModelArts Notebook进行云端数据调试及模型开发。

Notebook入门:一键部署Qwen3-8B模型并搭建聊天机器人

Notebook

大模型推理

本文聚焦于Qwen3-8B模型的本地高效部署,基于华为昇腾NPU环境,使用vLLM-Ascend推理引擎推理API服务。通过JupyterLab集成调试,展示从模型加载到RESTful接口调用的完整流程,最后通过Gradio组件来生成Chatbot类型的前端UI展示,快速搭建一个聊天机器人。

ModelArts平台模型训练案例

表2 自定义算法样例列表

样例

镜像

对应功能

场景

说明

使用ModelArts自定义算法实现手写数字识别

PyTorch

自定义算法

手写数字识别

使用用户自己的算法,训练得到手写数字识别模型,并部署后进行预测。

ModelArt平台推理部署

表3 推理部署列表

样例

场景

说明

第三方推理框架迁移到ModelArts推理自定义引擎

第三方框架

推理部署

ModelArts支持第三方的推理框架在ModelArts上部署,本文以TFServing框架、Triton框架为例,介绍如何迁移到推理自定义引擎。

ModelArt平台数据工程

表4 推理部署列表

样例

场景

说明

数据精炼入门:一键完成数据精炼

数据精炼

本文档帮助您快速上手华为ModelArts一键精炼功能,使用ModelArts一键精炼的“单轮问答处理流程”模板,自动剔除脏数据、去重并标准化格式,生成高纯净度的问答数据集,直接用于大语言模型微调训练。

相关文档