更新时间:2024-11-29 GMT+08:00
ALM-12040 操作系统熵值不足
告警解释
系统每五分钟执行一次告警检查,首先检查是否启用并正确配置了rng-tools或者haveged工具,如果没有配置,则发送故障告警。否则继续检查熵值,如果连续五次检测结果均小于100,则上报故障告警。
当检测到节点已经安装并启用了rng-tools或者haveged工具,且五次熵值检查中,至少有一次熵值大于等于100,则告警恢复。
告警属性
告警ID |
告警级别 |
告警类型 |
业务类型 |
是否可自动清除 |
---|---|---|---|---|
12040 |
紧急 |
环境告警 |
FusionInsight Manager |
是 |
告警参数
类别 |
参数名称 |
参数含义 |
---|---|---|
定位信息 |
来源 |
产生告警的集群或系统名称。 |
服务名 |
产生告警的服务名称。 |
|
角色名 |
产生告警的角色名称。 |
|
主机名 |
产生告警的主机名。 |
|
附加信息 |
详细信息 |
产生告警的详细信息。 |
对系统的影响
节点的操作系统熵值不足,可能导致该节点上加解密等命令执行慢,进而引起各实例业务处理性能下降,甚至业务进程无法正常执行。
可能原因
- haveged或者rng-tools工具未安装或未启动。
- 系统熵值连续多次检测低于100。
处理步骤
检查haveged或rng-tools工具是否安装或启动。
- 在FusionInsight Manager界面,选择“运维 > 告警 > 告警”。
- 查看该“定位信息”中对应的“主机名”字段值,获取该告警产生的主机名。
- 以root用户登录告警所在节点。
- 执行/bin/rpm -qa | grep -w "haveged"命令查看haveged安装情况,观察命令返回结果是否为空。
- 执行/sbin/service haveged status |grep "running",查看返回结果。
- 执行/bin/rpm -qa | grep -w "rng-tools"命令,查看rng-tools安装情况,观察命令返回结果是否为空。
- 执行ps -ef | grep -v "grep" | grep rngd | tr -d " " | grep "\-r/dev/urandom",查看返回结果。
检查系统熵值。
- 手动检查操作系统熵值。
以root用户登录节点,执行cat /proc/sys/kernel/random/entropy_avail命令,检查操作系统熵值是否满足集群的安装要求(不低于100)。
- 等待第二天零点,系统下一次熵值检查,查看告警是否自动清除。
- 是,操作结束。
- 否,执行10。
收集故障信息。
告警清除
此告警修复后,系统会自动清除此告警,无需手工清除。
参考信息
不涉及。
父主题: 告警参考