更新时间:2025-08-09 GMT+08:00
修改MRS集群NTP服务器
如果未配置NTP服务器或已配置的NTP不再使用,管理员可以为MRS集群重新指定或者更换新的NTP服务器,使集群从新的NTP时钟源同步时间。
约束与限制
本章节仅适用于MRS 3.x及以后版本。
前提条件
- 已准备新的NTP服务器,服务器的NTP服务状态正常。
- MRS集群与新NTP服务器的网络已互通。
对系统的影响
- 更换NTP服务器是高危操作,更换后集群时间可能将会变化。
- 更换NTP服务器前NTP服务器与集群当前时间偏差大于150s,则需先停止集群,防止数据丢失。停止集群期间服务无法访问。
- 如果NTP服务器与集群当前时间偏差大于15分钟,集群访问OBS会连接失败。
- 对于开启Kerberos认证集群,如果NTP服务器与集群当前时间偏差大于5分钟,会导致认证失败。
修改集群NTP服务器
- 登录MRS集群Manager界面,查看是否存在未清除的告警?
登录集群Manager界面请参考访问MRS集群Manager。
- 以root用户分别登录集群主、备管理节点。
MRS集群主备管理节点信息可参考查看MRS集群主备管理节点获取。
root用户密码为创建MRS集群时用户自定义密码。
成功登录后,执行以下命令切换到omm用户。
su - omm
- 在主管理节点执行以下命令查看管理平面网关。
cat ${BIGDATA_HOME}/om-server/OMS/workspace/conf/oms-config.ini | grep om_gateway
- 在主、备管理节点分别执行以下命令,检查节点是否与管理平面网关连通?
ping 管理平面网关
- 在主管理节点执行以下命令,获取当前环境NTP服务器域名。
本章节后续步骤中将以“ntp.myhuaweicloud.com”为例进行说明。
cat /opt/Bigdata_func/cloudinit/cloudinit_params | grep ntpserver
- 在主管理节点执行以下命令,检查集群时间与新的NTP服务器时间偏差。
例如,检查与NTP服务器“ntp.myhuaweicloud.com”的时间差,执行以下命令:
ntpdate -d ntp.myhuaweicloud.com
界面显示:
6 Dec 15:16:10 ntpdate[2861453]: step time server 10.79.3.251 offset +2.118107 sec
其中+2.118107 sec表示时间偏差,单位为秒。正数表示NTP服务器时间比集群当前时间快,负数表示NTP服务器时间比集群当前时间慢。 - 检查时间偏差的绝对值是否超过“150”。
- 确认是否可以停止集群。
- 是,停止上层业务并停止集群,然后执行步骤 9。
- 否,任务结束。
- 确认NTP服务器时间是否比集群当前时间慢?
- 在主管理节点执行以下命令,更换NTP服务器,任务结束。
sh ${BIGDATA_HOME}/om-server/om/bin/tools/modifyntp.sh --ntp_server_ip ntp.myhuaweicloud.com
NTP服务器IP地址不可以设置为集群内节点IP地址,否则可能会导致节点与主备管理节点业务网络断连。
- 在主管理节点执行以下命令,从NTP服务器“ntp.myhuaweicloud.com”立即强制同步时间并更换NTP服务器,任务结束。
sh ${BIGDATA_HOME}/om-server/om/bin/tools/modifyntp.sh --ntp_server_ip ntp.myhuaweicloud.com --force_sync_time
- 如果停止了集群,在更换NTP服务器后需要重新启动集群。
- 执行强制同步时间命令后,集群节点大约需要5分钟完成时间同步。