方案概述

该解决方案基于魔坊（ModelArts）模型训推平台在轻量算力节点极速部署AI模型，为企业提供高性能、高安全、可定制的大模型服务，能够充分满足高并发、低延迟、数据安全合规等核心需求，助力企业快速落地AI应用。

适用于如下场景：

1、智能客服：自动应答常见问题，处理退换货、物流查询，降低人工成本。

2、内容创作：协助撰写邮件、报告、文案、稿件等，提供写作灵感。

3、信息总结：快速提炼文档、会议记录、合同的核心要点，提升处理效率。

4、代码开发：生成代码片段、解释逻辑、辅助排查错误。

5、语言翻译：支持多语种互译，并润色译文使其更地道。

6、教育培训：解释概念、解答疑问、生成练习题，提供个性化辅导。

该解决方案基于魔坊（ModelArts）模型训推平台在轻量算力节点极速部署AI模型。

图1 方案架构图

该解决方案将会部署如下资源：

已完成昇腾云裸轻量算力节点下单，操作步骤参考轻量算力节点资源开通，请联系您所在企业的华为技术工程师支撑购买
轻量算力节点配置要求：
规格名称：modelarts.bm.npu.arm.8snt9b2.d、modelarts.bm.npu.arm.8snt9b3.d

卡数：8*snt9b2、8*snt9b3

计费规则：包年/包月
轻量算力节点操作系统镜像：HCE2.0-Arm-64bit-for-Snt9A2-BareMetal-with-24.1.0.6-7.5.0.5.220-CANN8.0.1-v2
确保轻量算力节点22端口安全组已开通
支持Region：西南贵阳一、乌兰察布一
版本说明和要求：

版本

版本说明

支持模型列表

6.5.908

魔坊（ModelArts）模型训推平台6.5.908官方版本

表1

开源版本

Vllm-Ascend开源版本

表2