更新时间:2026-05-12 GMT+08:00
分享

方案概述

应用场景

该解决方案基于魔坊(ModelArts)模型训推平台在轻量算力节点极速部署AI模型,为企业提供高性能、高安全、可定制的大模型服务,能够充分满足高并发、低延迟、数据安全合规等核心需求,助力企业快速落地AI应用。

适用于如下场景:

1、智能客服:自动应答常见问题,处理退换货、物流查询,降低人工成本。

2、内容创作:协助撰写邮件、报告、文案、稿件等,提供写作灵感。

3、信息总结:快速提炼文档、会议记录、合同的核心要点,提升处理效率。

4、代码开发:生成代码片段、解释逻辑、辅助排查错误。

5、语言翻译:支持多语种互译,并润色译文使其更地道。

6、教育培训:解释概念、解答疑问、生成练习题,提供个性化辅导。

方案架构

该解决方案基于魔坊(ModelArts)模型训推平台在轻量算力节点极速部署AI模型。

图1 方案架构图

该解决方案将会部署如下资源:

  • 魔坊(ModelArts)模型训推平台创建一台昇腾云轻量算力节点,用于部署AI模型。
  • 创建一个弹性公网IP EIP并关联轻量算力节点,提供访问公网和被公网访问能力。
  • 创建一个安全组,通过配置安全组规则,为云服务器提供安全防护。

方案优势

  • 一键部署,免人工干预

    单条命令触发全流程自动化,无需手动编写指令或逐项配置。一键部署总耗时仅15分钟,较传统方式效率提升10倍以上

  • 自动检测环境依赖

    智能校验NPU、驱动及Docker运行状态,自动补全缺失组件,从源头减少人为错误,支撑业务快速迭代更新

  • OBS高速同步权重

    基于华为OBS高速传输自动拉取模型权重,相比手动上传显著提升同步效率,模型准备时间从小时级压缩至分钟级

  • 端到端自动化闭环

    覆盖镜像构建、容器启动到环境配置全流程,无需人工介入,无需精通底层技术,真正实现开箱即用、即启即用。

约束与限制

  • 已完成昇腾云裸轻量算力节点下单,操作步骤参考轻量算力节点资源开通,请联系您所在企业的华为技术工程师支撑购买
  • 轻量算力节点配置要求:

    规格名称:modelarts.bm.npu.arm.8snt9b2.d、modelarts.bm.npu.arm.8snt9b3.d

    卡数:8*snt9b2、8*snt9b3

    计费规则:包年/包月

  • 轻量算力节点操作系统镜像:HCE2.0-Arm-64bit-for-Snt9A2-BareMetal-with-24.1.0.6-7.5.0.5.220-CANN8.0.1-v2
  • 确保轻量算力节点22端口安全组已开通
  • 支持Region:西南贵阳一、乌兰察布一
  • 版本说明和要求:

    版本

    版本说明

    支持模型列表

    6.5.908

    魔坊(ModelArts)模型训推平台6.5.908官方版本

    表1

    开源版本

    Vllm-Ascend开源版本

    表2

相关文档