文档首页/
AI开发平台ModelArts/
最佳实践/
DeepSeek基于Lite Server&Cluster推理/
Qwen3模型基于ModelArts Lite Server适配NPU的混部推理解决方案/
查看指标、配置告警/
配置推理层监控告警/
在CES中查看指标并配置告警
更新时间:2025-09-08 GMT+08:00
在CES中查看指标并配置告警
组件 |
关键指标 |
告警阈值 |
参考文档 |
---|---|---|---|
Lite Server |
NPU使用率 |
连续2个周期原始值 > 95% |
|
NPU显存使用率 |
连续2个周期原始值 > 98% |
||
NPU卡的健康状况 |
连续2个周期原始值 > 0 |
父主题: 配置推理层监控告警