更新时间:2023-03-17 GMT+08:00

ALM-12040 系统熵值不足

告警解释

每天零点系统检查熵值,每次检查都连续检查五次,首先检查是否启用并正确配置了rng-tools工具或者haveged工具,如果没有配置,则继续检查当前熵值,如果五次均小于100,则上报故障告警。

当检查到真随机数方式已经配置或者伪随机数方式中配置了随机数参数或者没有配置但是五次检查中,至少有一次熵值大于等于100,则告警恢复。

告警属性

告警ID

告警级别

是否自动清除

12040

重要

告警参数

参数名称

参数含义

来源

产生告警的集群或系统名称。

服务名

产生告警的服务名称。

角色名

产生告警的角色名称。

主机名

产生告警的主机名。

对系统的影响

影响系统正常运行。

可能原因

haveged服务或者rngd服务异常。

处理步骤

检查并手动配置系统熵值。

  1. 在FusionInsight Manager界面,选择“运维 > 告警 > 告警”。
  2. 查看该“定位信息”中对应的“主机名”字段值,获取该告警产生的主机名。
  3. root用户登录告警所在节点
  4. 执行/bin/rpm -qa | grep -w "haveged"命令查看haveged安装情况,观察命令返回结果是否为空。

    • 是,执行7
    • 否,执行5

  5. 执行/sbin/service haveged status |grep "running",查看返回结果。

    • 如果执行成功,表示haveged服务安装并正常配置运行,执行10
    • 如果执行不成功,表示haveged服务没有正常运行。执行7

  6. 执行/bin/rpm -qa | grep -w "rng-tools"命令,查看rng-tools安装情况,观察命令返回结果是否为空。

    • 是,执行8
    • 否,执行7

  7. 执行ps -ef | grep -v "grep" | grep rngd | tr -d " " | grep "\-o/dev/random" | grep "\-r/dev/urandom",查看返回结果。

    • 如果执行成功,表示rngd服务安装并正常配置运行,执行10
    • 如果执行不成功,表示rngd服务并没有正常运行,执行8

  8. 手动配置系统熵值设置,设置方法参见参考信息
  9. 等待第二天零点,系统下一次熵值检查,查看告警是否自动清除。

    • 是,操作结束。
    • 否,执行10

收集故障信息。

  1. 在FusionInsight Manager界面,选择“运维 > 日志 > 下载”。
  2. 在“服务”中勾选“NodeAgent”,单击“确定”。
  3. 单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分钟,单击“下载”。
  4. 请联系运维人员,并发送已收集的故障日志信息。

告警清除

此告警修复后,系统会自动清除此告警,无需手工清除。

参考信息

手动检查操作系统熵值

root用户登录节点,执行cat /proc/sys/kernel/random/entropy_avail命令,检查操作系统熵值是否满足集群的安装要求(不低于500)。如果低于500,可使用以下两种方式之一进行配置:

  • 使用“haveged”工具(真随机数方式):请联系OS供应商安装并启动该工具。
  • 使用“rng-tools”工具(伪随机数方式):请联系OS供应商安装该工具,并根据操作系统类型进行配置:
    • Red Hat和CentOS下:执行以下命令进行配置:

      echo 'EXTRAOPTIONS="-r /dev/urandom -o /dev/random -t 1 -i"' >> /etc/sysconfig/rngd

      service rngd start

      chkconfig rngd on

    • SUSE下:执行以下命令进行配置:

      rngd -r /dev/urandom -o /dev/random

      echo "rngd -r /dev/urandom -o /dev/random" >> /etc/rc.d/after.local