ALM-12040 系统熵值不足
告警解释
每天零点系统检查熵值,每次检查都连续检查五次,首先检查是否启用并正确配置了rng-tools工具或者haveged工具,如果没有配置,则继续检查当前熵值,如果五次均小于100,则上报故障告警。
当检查到真随机数方式已经配置或者伪随机数方式中配置了随机数参数,或者两者均没有配置但是五次检查中,至少有一次熵值大于等于100,则告警恢复。
告警属性
告警ID |
告警级别 |
是否自动清除 |
---|---|---|
12040 |
重要 |
是 |
告警参数
参数名称 |
参数含义 |
---|---|
来源 |
产生告警的集群或系统名称。 |
服务名 |
产生告警的服务名称。 |
角色名 |
产生告警的角色名称。 |
主机名 |
产生告警的主机名。 |
对系统的影响
影响系统正常运行。
可能原因
- haveged或者rng-tools工具未安装或未启动。
- 系统熵值连续多次检测低于100。
处理步骤
检查haveged或rng-tools工具是否安装或启动。
- 在FusionInsight Manager界面,选择“运维 > 告警 > 告警”。
- 查看该“定位信息”中对应的“主机名”字段值,获取该告警产生的主机名。
- 以root用户登录告警所在节点。
- 执行/bin/rpm -qa | grep -w "haveged"命令查看haveged安装情况,观察命令返回结果是否为空。
- 执行/sbin/service haveged status |grep "running",查看返回结果。
- 执行/bin/rpm -qa | grep -w "rng-tools"命令,查看rng-tools安装情况,观察命令返回结果是否为空。
- 执行ps -ef | grep -v "grep" | grep rngd | tr -d " " | grep "\-r/dev/urandom",查看返回结果。
检查系统熵值。
- 手动检查操作系统熵值。
以root用户登录节点,执行cat /proc/sys/kernel/random/entropy_avail命令,检查操作系统熵值是否满足集群的安装要求(不低于100)。
- 是,操作系统熵值不低于100,执行9。
- 否,操作系统熵值低于100,可使用以下两种方式之一进行配置,然后执行9。
- 方式一:使用“haveged”工具(真随机数方式):请联系操作系统供应商安装并启动该工具。
vi /usr/lib/systemd/system/haveged.service
编辑[Service]项中Type、ExecStar、SuccessExitStatus、Restart参数值如下所示:
Type=simple ExecStar=/usr/sbin/haveged -w 1024 -v 1 –Foreground SuccessExitStatus=137 143 Restart=always
- 方式二:使用“rng-tools”工具(伪随机数方式):请联系操作系统供应商安装并启动该工具,并根据操作系统类型进行配置。
- Red Hat和CentOS下:执行以下命令进行配置
echo 'EXTRAOPTIONS="-r /dev/urandom -o /dev/random -t 1 -i"' >> /etc/sysconfig/rngd
service rngd start
chkconfig rngd on
- SUSE下:执行以下命令进行配置
rngd -r /dev/urandom -o /dev/random
echo "rngd -r /dev/urandom -o /dev/random" >> /etc/rc.d/after.local
- 银河麒麟:在告警上报节点使用root用户执行以下命令进行配置
vi /usr/lib/systemd/system/rngd.service
编辑[Service]项中ExecStart参数值如下:
ExecStart=/sbin/rngd -f -r /dev/urandom -s 2048
- Red Hat和CentOS下:执行以下命令进行配置
- 方式一:使用“haveged”工具(真随机数方式):请联系操作系统供应商安装并启动该工具。
- 等待第二天零点,系统下一次熵值检查,查看告警是否自动清除。
- 是,操作结束。
- 否,执行10。
收集故障信息。
告警清除
此告警修复后,系统会自动清除此告警,无需手工清除。