ALM-12040 系统熵值不足
告警解释
MRS 3.2.0及之后版本:
系统每五分钟执行一次告警检查,首先检查是否启用并正确配置了rng-tools或者haveged工具,如果没有配置,则发送故障告警。否则继续检查熵值,如果连续五次检测结果均小于100,则上报故障告警。
当检测到节点已经安装并启用了rng-tools或者haveged工具,且五次熵值检查中,至少有一次熵值大于等于100,则告警恢复。
MRS 3.1.2及之前版本:
每天零点系统检查熵值,每次检查都连续检查五次,首先检查是否启用并正确配置了rng-tools工具或者haveged工具,如果没有配置,则继续检查当前熵值,如果五次均小于100,则上报故障告警。
当检查到真随机数方式已经配置或者伪随机数方式中配置了随机数参数,或者两者均没有配置但是五次检查中,至少有一次熵值大于等于100,则告警恢复。
MRS 3.3.1及之后版本,告警名称从“系统熵值不足”变成“操作系统熵值不足”。
告警属性
告警ID |
告警级别 |
是否自动清除 |
---|---|---|
12040 |
重要 |
是 |
告警参数
参数名称 |
参数含义 |
---|---|
来源 |
产生告警的集群或系统名称。 |
服务名 |
产生告警的服务名称。 |
角色名 |
产生告警的角色名称。 |
主机名 |
产生告警的主机名。 |
对系统的影响
节点的操作系统熵值不足,可能导致该节点上加解密等命令执行慢,进而引起各实例业务处理性能下降,甚至业务进程无法正常执行。
可能原因
- haveged或者rng-tools工具未安装或未启动。
- 系统熵值连续多次检测低于100。
处理步骤
检查haveged或rng-tools工具是否安装或启动。
- 在FusionInsight Manager界面,选择“运维 > 告警 > 告警”。
- 查看该“定位信息”中对应的“主机名”字段值,获取该告警产生的主机名。
- 以root用户登录告警所在节点。
- 执行/bin/rpm -qa | grep -w "haveged"命令查看haveged安装情况,观察命令返回结果是否为空。
- 执行/sbin/service haveged status |grep "running",查看返回结果。
- 执行/bin/rpm -qa | grep -w "rng-tools"命令,查看rng-tools安装情况,观察命令返回结果是否为空。
- 执行ps -ef | grep -v "grep" | grep rngd | tr -d " " | grep "\-r/dev/urandom",查看返回结果。
检查系统熵值。
- 手动检查操作系统熵值。
以root用户登录节点,执行cat /proc/sys/kernel/random/entropy_avail命令,检查操作系统熵值是否满足集群的安装要求(不低于100)。
- 等待第二天零点,系统下一次熵值检查,查看告警是否自动清除。
- 是,操作结束。
- 否,执行10。
收集故障信息。
告警清除
此告警修复后,系统会自动清除此告警,无需手工清除。