文档首页/ MapReduce服务 MRS/ 用户指南/ MRS集群运维/ MRS集群告警处理参考/ ALM-12037 NTP服务器异常(2.x及以前版本)
更新时间:2024-10-21 GMT+08:00
分享

ALM-12037 NTP服务器异常(2.x及以前版本)

告警解释

当NTP服务器异常时产生该告警。

当NTP服务器异常消除时,该告警恢复。

告警属性

告警ID

告警级别

可自动清除

12037

严重

告警参数

参数名称

参数含义

ServiceName

产生告警的服务名称。

RoleName

产生告警的角色名称。

HostName

异常NTP服务器的IP地址。

对系统的影响

主OMS节点配置的NTP服务器异常,可能会导致主OMS节点与外部服务器不能同步时间,集群时间可能会产生误差

可能原因

  • NTP服务器网络异常。
  • 与NTP服务器认证失败。
  • 不能从NTP服务器获取时间。
  • 从NTP服务器获取的时间持续未更新。

处理步骤

  1. 检查NTP服务器网络。

    1. 打开MRS集群详情页面,在实时告警列表中,单击此告警所在行。
    2. 在“告警详情”区域,查看告警附加信息,是否提示无法ping通NTP服务器IP。
      • 是,执行1.c
      • 否,执行2
    3. 联系运维人员检查网络配置,确保NTP服务器与主OMS节点网络正常,然后检查告警是否恢复。
      • 是,处理完毕。
      • 否,执行2

  2. 检查与NTP服务器认证是否失败。

    1. 登录主管理节点。
    2. 执行查看状态命令ntpq -np检查集群与NTP服务器认证是否失败?对应NTP服务器“refid”项显示“.AUTH.”表示认证失败。
      • 是,执行5
      • 否,执行3

  3. 检查是否能从NTP服务器获取时间。

    1. 继续查看告警附加信息,是否提示不能从NTP服务器获取时间。
      • 是,执行3.b
      • 否,执行4
    2. 联系运维人员,处理NTP服务器异常。确保NTP服务器正常后检查告警是否恢复。
      • 是,处理完毕。
      • 否,执行4

  4. 检查从NTP服务器获取的时间是否持续未更新。

    1. 继续查看告警附加信息,是否提示从NTP服务器获取时间持续未更新。
      • 是,执行4.b
      • 否,执行5
    2. 联系NTP服务器的服务商,解决NTP服务器异常。确保NTP服务器正常后检查告警是否恢复。
      • 是,处理完毕。
      • 否,执行5

  5. 收集故障信息。

    1. 在MRS Manager界面,单击“系统设置 > 日志导出”。
    2. 请联系运维人员,并发送已收集的故障日志信息。

参考信息

无。

相关文档