模型部署形态、架构和卡型
| 模型名称 | 云上部署 | 边缘部署 | |||
|---|---|---|---|---|---|
| ARM+D310P | ARM+Snt9B | ARM+D310P | ARM+Snt9B | X86+D310P | |
| 盘古融合推荐异常检测大模型(Pangu-Predict-Anom-Table-V2.0.3) | 支持,1卡部署 | 不支持 | 支持,1卡部署 | 不支持 | 不支持 |
| 盘古时序异常检测大模型(Pangu-Predict-Anom-TS-3.0.1) | 支持,1卡部署 | 不支持 | 支持,1卡部署 | 不支持 | 不支持 |
| 盘古统一编码时序预测分类大模型(Pangu-Predict-Cla-TS-V3.0.3) | 支持,1卡部署 | 不支持 | 支持,1卡部署 | 不支持 | 不支持 |
| 盘古统一编码表格预测分类大模型(Pangu-Predict-Cla-Table-V3.0.1) | 支持,1卡部署 | 不支持 | 支持,1卡部署 | 不支持 | 不支持 |
| 盘古融合推荐分类大模型(Pangu-Predict-Cla-Table-V2.0.3) | 支持,1卡部署 | 不支持 | 支持,1卡部署 | 不支持 | 不支持 |
| 盘古融合推荐分类大模型-极简模式(Pangu-Predict-Cla-Table-V2.1.4) | 不支持 | 支持,1卡部署 | 不支持 | 支持,1卡部署 | 不支持 |
| 盘古统一编码时序预测回归大模型(Pangu-Predict-Reg-TS-V3.1.1) | 支持,1卡部署 | 不支持 | 支持,1卡部署 | 不支持 | 不支持 |
| 盘古时序预测直推回归大模型(Pangu-Predict-Reg-Zeroshot-TS-V3.0.0) | 不支持 | 支持,1卡部署 | 不支持 | 支持,1卡部署 | 不支持 |
| 盘古统一编码表格预测回归大模型(Pangu-Predict-Reg-Table-V3.0.1) | 支持,1卡部署 | 不支持 | 支持,1卡部署 | 不支持 | 不支持 |
| 盘古融合推荐回归大模型(Pangu-Predict-Reg-Table-V2.0.3) | 支持,1卡部署 | 不支持 | 支持,1卡部署 | 不支持 | 不支持 |
| 盘古融合推荐回归大模型-极简模式(Pangu-Predict-Reg-Table-V2.1.4) | 不支持 | 支持,1卡部署 | 不支持 | 支持,1卡部署 | 不支持 |
| Pangu-Predict-FewShot-Table-V3.0.1 | 支持,1卡部署 | 不支持 | 支持,1卡部署 | 不支持 | 不支持 |
| 高速交通流量预测模型(Pangu-Predict-Industry-Traffic-V3.0.0) | 支持,1卡部署 | 不支持 | 支持,1卡部署 | 不支持 | 不支持 |
| 供应链需求预测模型(Pangu-Predict-Industry-Demand-V1.0.0) | 支持,1卡部署 | 不支持 | 支持,1卡部署 | 不支持 | 不支持 |
| 模型名称 | 云上部署 | 边缘部署 | ||
|---|---|---|---|---|
| ARM | X86 | ARM | X86 | |
| 结构化数据预测(Pangu-Predict-StructurePredict-V1.1.0) | 支持,不消耗卡 | 支持,不消耗卡 | 支持,不消耗卡 | 支持,不消耗卡 |
- 预测大模型云上部署支持算力硬切分,云上部署资源池算力切分是将资源池的资源进行硬切分的一种方式,将单资源切分为多资源,旨在资源的充分利用,减少资源浪费。详情请参考《盘古大模型服务 (PanguLM) 8.6.1 配置指南 (for 华为云Stack 8.6.1) 01》中的“资源池 > 配置云上部署资源池算力切分”章节。
- 预测大模型边缘部署支持算力软切分,算力软切分指的是对NPU算力资源进行逻辑划分与动态分配,实现多任务、多模型并发运行。算力共享支持的模型部署个数可参考华为云Stack 8.6.1盘古预测大模型性能基线表格,请联系服务技术支持协助获取。