更新时间:2026-06-17 GMT+08:00
分享

模型部署形态、架构和卡型

表1 预测大模型支持的部署形态、架构和卡型

模型名称

云上部署

边缘部署

ARM+D310P

ARM+Snt9B

ARM+D310P

ARM+Snt9B

X86+D310P

盘古融合推荐异常检测大模型(Pangu-Predict-Anom-Table-V2.0.3)

支持,1卡部署

不支持

支持,1卡部署

不支持

不支持

盘古时序异常检测大模型(Pangu-Predict-Anom-TS-3.0.1)

支持,1卡部署

不支持

支持,1卡部署

不支持

不支持

盘古统一编码时序预测分类大模型(Pangu-Predict-Cla-TS-V3.0.3)

支持,1卡部署

不支持

支持,1卡部署

不支持

不支持

盘古统一编码表格预测分类大模型(Pangu-Predict-Cla-Table-V3.0.1)

支持,1卡部署

不支持

支持,1卡部署

不支持

不支持

盘古融合推荐分类大模型(Pangu-Predict-Cla-Table-V2.0.3)

支持,1卡部署

不支持

支持,1卡部署

不支持

不支持

盘古融合推荐分类大模型-极简模式(Pangu-Predict-Cla-Table-V2.1.4)

不支持

支持,1卡部署

不支持

支持,1卡部署

不支持

盘古统一编码时序预测回归大模型(Pangu-Predict-Reg-TS-V3.1.1)

支持,1卡部署

不支持

支持,1卡部署

不支持

不支持

盘古时序预测直推回归大模型(Pangu-Predict-Reg-Zeroshot-TS-V3.0.0)

不支持

支持,1卡部署

不支持

支持,1卡部署

不支持

盘古统一编码表格预测回归大模型(Pangu-Predict-Reg-Table-V3.0.1)

支持,1卡部署

不支持

支持,1卡部署

不支持

不支持

盘古融合推荐回归大模型(Pangu-Predict-Reg-Table-V2.0.3)

支持,1卡部署

不支持

支持,1卡部署

不支持

不支持

盘古融合推荐回归大模型-极简模式(Pangu-Predict-Reg-Table-V2.1.4)

不支持

支持,1卡部署

不支持

支持,1卡部署

不支持

Pangu-Predict-FewShot-Table-V3.0.1

支持,1卡部署

不支持

支持,1卡部署

不支持

不支持

高速交通流量预测模型(Pangu-Predict-Industry-Traffic-V3.0.0)

支持,1卡部署

不支持

支持,1卡部署

不支持

不支持

供应链需求预测模型(Pangu-Predict-Industry-Demand-V1.0.0)

支持,1卡部署

不支持

支持,1卡部署

不支持

不支持

模型名称

云上部署

边缘部署

ARM

X86

ARM

X86

结构化数据预测(Pangu-Predict-StructurePredict-V1.1.0)

支持,不消耗卡

支持,不消耗卡

支持,不消耗卡

支持,不消耗卡

  • 预测大模型云上部署支持算力硬切分,云上部署资源池算力切分是将资源池的资源进行硬切分的一种方式,将单资源切分为多资源,旨在资源的充分利用,减少资源浪费。详情请参考《盘古大模型服务 (PanguLM) 8.6.1 配置指南 (for 华为云Stack 8.6.1) 01》中的“资源池 > 配置云上部署资源池算力切分”章节。
  • 预测大模型边缘部署支持算力软切分,算力软切分指的是对NPU算力资源进行逻辑划分与动态分配,实现多任务、多模型并发运行。算力共享支持的模型部署个数可参考华为云Stack 8.6.1盘古预测大模型性能基线表格,请联系服务技术支持协助获取。

相关文档