ALM-12037 Servidor NTP anormal
Descripción
El sistema comprueba el estado del servidor NTP cada 60 segundos. Esta alarma se genera cuando el sistema detecta que el servidor NTP es anormal durante 10 veces consecutivas.
Esta alarma se borra cuando el servidor NTP se recupera.
Atributo
ID de alarma |
Gravedad de la alarma |
Borrar automáticamente |
---|---|---|
12037 |
Importante |
Sí |
Parámetros
Nombre |
Significado |
---|---|
Source |
Especifica el clúster o sistema para el que se genera la alarma. |
ServiceName |
Especifica el servicio para el que se genera la alarma. |
RoleName |
Especifica el rol para el que se genera la alarma. |
HostName |
Especifica la dirección IP del servidor NTP para el que se genera la alarma. |
Impacto en el sistema
El servidor NTP configurado en el nodo OMS activo es anormal. En este caso, el nodo OMS activo no puede sincronizar el tiempo con el servidor NTP y se puede generar un desplazamiento de tiempo en el clúster.
Causas posibles
- La red del servidor NTP es anormal.
- La autenticación del servidor NTP falla.
- No se puede obtener la hora del servidor NTP.
- El tiempo obtenido del servidor NTP no se actualiza continuamente.
Procedimiento
Comprobar la red de servidor NTP.
- En el portal del FusionInsight Manager, haga clic en O&M > Alarm > Alarms y haga clic en en la fila donde se encuentra la alarma.
- Vea la información adicional de la alarma para comprobar si el servidor NTP no se puede hacer ping.
- Póngase en contacto con el administrador de la red para comprobar la configuración de la red y asegurarse de que la red entre el servidor NTP y el nodo OMS activo es normal. Luego, verifique si la alarma se rectificó.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 4.
Comprobar si la autenticación de servidor NTP falla.
- Inicie sesión en el nodo OMS activo como usuario root.
- Ejecute el siguiente comando para comprobar el estado de los recursos en los nodos activo y en espera:
su - omm
sh ${BIGDATA_HOME}/om-server/om/sbin/status-oms.sh
- Si aparece "chrony" en la columna ResName de la salida del comando, vaya a 6.
- Si aparece "ntp" en la columna ResName, vaya a 7.
Si tanto "chrony" como "ntp" se muestran en la columna ResName de la salida del comando, el modo de servicio NTP se está conmutando. Espera 10 minutos y vuelve a realizar 5. Si tanto "chrony" como "ntp" todavía existen en la columna ResName, póngase en contacto con.
- Ejecute el comando chronyc sources para comprobar si falla la autenticación del servidor NTP.
Si el valor de Reach para chrony es de 0, se produce un error en la conexión o autenticación.
- Ejecute el comando ntpq -np para comprobar si falla la autenticación del servidor NTP.
Si refid del servidor NTP es.AUTH., la autenticación falla.
Comprobar si se puede obtener la hora del servidor NTP.
- Ver la información adicional de la alarma para comprobar si la hora se puede obtener del servidor NTP.
- Póngase en contacto con el proveedor del servidor NTP para rectificar la falla del servidor NTP. Después de que el servidor NTP sea normal, compruebe si la alarma está borrada.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 10.
Comprobar si la hora obtenida del servidor NTP no se actualiza continuamente.
- Ver la información adicional de la alarma para comprobar si la hora obtenida del servidor NTP no se actualiza continuamente.
- Póngase en contacto con el proveedor del servidor NTP para rectificar la falla del servidor NTP. Después de que el servidor NTP sea normal, compruebe si la alarma está borrada.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 12.
Recopilar información de fallas.
- En el FusionInsight Manager, elija O&M > Log > Download.
- Seleccione NodeAgent y OmmServer en el Service y haga clic en OK.
- Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 30 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
- Póngase en contacto con el y envíe la información de registro recopilada.
Eliminación de alarmas
Después de rectificar la falla, el sistema borra automáticamente esta alarma.
Información relacionada
Ninguna