更新时间:2025-03-31 GMT+08:00

iMetal服务器支持的监控指标

本章节主要介绍iMetal服务器的带外监控相关指标。

iMetal服务器硬件监控指标

表1 iMetal服务器硬件监控指标

指标名称

指标

指标说明

电源输入功率

power_input_watts

该指标用于显示电源输入功率。

电源输出功率

power_output_watts

该指标用于显示电源输出功率。

组件温度

device_temperature

该指标用于显示组件的温度。

主机健康状态

host_health

该指标用于显示主机是否健康。

处理器健康状态

cpu_health

该指标用于显示处理器是否健康。

内存健康状态

memory_health

该指标用于显示内存是否健康。

磁盘健康状态

disk_health

该指标用于显示磁盘是否健康。

电源健康状态

power_health

该指标用于显示电源是否健康。

网卡健康状态

nic_health

该指标用于显示网卡是否健康。

风扇健康状态

fan_health

该指标用于显示风扇是否健康。

iMetal服务器告警趋势指标

表2 iMetal服务器告警趋势指标

指标

指标说明

host

该指标用于统计某一时刻整机告警数量,来源于告警中维度为host_health的告警数。

type_cpu

该指标用于统计某一时刻处理器告警数量,来源于告警中维度为cpu_health的告警数。

type_memory

该指标用于统计某一时刻内存告警数量,来源于告警中维度为memory_health的告警数。

type_disk

该指标用于统计某一时刻磁盘告警数量,来源于告警中维度为disk_health的告警数。

type_power

该指标用于统计某一时刻电源告警数量,来源于告警中维度为power_health的告警数。

type_fan

该指标用于统计某一时刻风扇告警数量,来源于告警中维度为fan_health的告警数。

type_nic

该指标用于统计某一时刻网卡告警数量,来源于告警中维度为nic_health的告警数。

level_critical

该指标用于统计某一时刻紧急告警数量,来源于告警中紧急告警级别的告警数。

level_major

该指标用于统计某一时刻重要告警数量,来源于告警中重要告警级别的告警数。

iRack机柜监控指标

表3 iRack机柜监控指标

指标

指标说明

rack_power

该指标用于显示机柜的功率。

rack_temp

该指标用于显示机柜的温度。