Indicadores de comprobación de estado de ZooKeeper
Latencia promedio de procesamiento de solicitudes de ZooKeeper
Indicador: Latencia promedio de procesamiento de solicitudes de servicio de ZooKeeper
Descripción: Este indicador se utiliza para comprobar el retraso promedio para que el servicio ZooKeeper procese las solicitudes. Si el retraso promedio es superior a 300 ms, el servicio ZooKeeper no está sano.
Guía de recuperación: Si el indicador es anormal, compruebe si la velocidad de red del clúster es normal y si el uso de memoria o CPU es demasiado alto.
Uso de conexiones de ZooKeeper
Indicador: Uso de conexiones de ZooKeeper
Descripción: Este indicador se utiliza para comprobar si el uso de memoria de ZooKeeper supera el 80%. Si el uso del disco excede el umbral, el sistema no está sano.
Guía de recuperación: Si el indicador es anormal, se recomienda aumentar la memoria disponible para el servicio ZooKeeper. El método para aumentar la memoria es el siguiente: Aumentar el valor de -Xmx en el elemento de configuración GC_OPTS del servicio ZooKeeper. Después de la modificación, reinicie el servicio ZooKeeper para que la configuración surta efecto.
Estado de salud del servicio
Indicador: Estado del servicio
Descripción: Este indicador se utiliza para comprobar si el estado del servicio de ZooKeeper es normal. Si el estado es anormal, el servicio no está sano.
Guía de recuperación: Si el indicador es anormal, compruebe si el estado de salud de los servicios KrbServer y LdapServer es defectuoso. De ser así, rectifique la falla. Inicie sesión en el cliente de ZooKeeper, compruebe si la escritura de datos de ZooKeeper falla. En caso afirmativo, busque la causa de la falla basándose en el mensaje de error y maneje la falla de acuerdo con el mensaje de error. Rectifique la falla siguiendo el procedimiento para el manejo de ALM-13000.
Comprobación de alarma
Indicador: Información de alarma
Descripción: Este indicador se utiliza para comprobar si existen alarmas. Si existen alarmas, el servicio no está sano.
Guía de recuperación: Si este indicador es anormal, puede corregir la falla consultando la guía de manejo de alarmas.