ALM-19015 El uso de cuotas de cantidad en el ZooKeeper supera el umbral
Descripción
El sistema comprueba el uso de ZNode del servicio HBase cada 120 segundos. Esta alarma se genera cuando el sistema detecta que el uso de la cantidad ZNode del servicio HBase supera el umbral de alarma (75% por defecto).
Esta alarma se borra cuando el uso de la cantidad de ZNode es menor que el umbral de alarma.
Atributo
ID de alarma |
Gravedad de la alarma |
Borrar automáticamente |
---|---|---|
19015 |
Importante |
Sí |
Parámetros
Nombre |
Significado |
---|---|
Source |
Especifica el clúster para el que se genera la alarma. |
ServiceName |
Especifica el servicio para el que se genera la alarma. |
RoleName |
Especifica el rol para el que se genera la alarma. |
HostName |
Especifica el host para el que se genera la alarma. |
Threshold |
Especifica el umbral para el que se genera la alarma. |
Impacto en el sistema
Esta alarma indica que el uso de la cantidad de ZNode en el servicio HBase ha excedido el umbral. Si esta alarma no se maneja de manera oportuna, la gravedad del problema puede escalarse a Critical lo que afecta a la escritura de datos.
Causas posibles
- La DR está configurada para HBase y la sincronización de datos falla o es lenta en la DR.
- Se está dividiendo un gran número de archivos WAL en el clúster HBase.
Procedimiento
Comprobar la cuota de cantidad y el uso de ZNodes.
- En FusionInsight Manager, seleccione O&M > Alarm > Alarms, seleccione la alarma cuyo ID es 19015 y vea el umbral en Additional Information.
- Inicie sesión en el cliente HBase como usuario root. Ejecute el siguiente comando para ir al directorio de instalación del cliente:
cd Client installation directory
Ejecute el siguiente comando para establecer variables de entorno:
source bigdata_env
Si el clúster utiliza el modo de seguridad, ejecute el siguiente comando para realizar la autenticación de seguridad:
kinit hbase
Ingrese la contraseña como se le solicite (obtenga la contraseña del administrador del clúster de MRS).
- Ejecute el comando hbase zkcli para iniciar sesión en el cliente ZooKeeper y ejecute el comando listquota /hbase para comprobar la cuota de cantidad ZNode del servicio HBase. El directorio raíz ZNode en el comando se especifica mediante el parámetro zookeeper.znode.parent del servicio HBase. El área marcada en la siguiente figura muestra la configuración de cuota de cantidad del ZNode raíz del servicio HBase.
- Ejecute el comando getusage /hbase/splitWAL para comprobar el uso de la cantidad de ZNode y verifique si la relación de Node count en la salida del comando a la cuota de cantidad de ZNode está cerca del umbral de alarma.
- En FusionInsight Manager, seleccione O&M > Alarm > Alarms. Compruebe si existe la alarma cuyo ID sea 12007, 19000 o 19013 y el ServiceName de Location es el servicio HBase actual.
- Ejecute el comando getusage /hbase/replication para comprobar el uso de la cantidad de ZNode y verifique si la relación de Node count en la salida del comando a la cuota de cantidad de ZNode está cerca del umbral de alarma.
- En FusionInsight Manager, seleccione O&M > Alarm > Alarms. Compruebe si la alarma cuyo ID es 19006 y ServiceName en Location es el servicio HBase actual existe.
- Verifique si la alarma se ha borrado.
- En caso afirmativo, no es necesario hacer nada más.
- Si no, vaya a 9.
Recopilar información de fallas.
- En FusionInsight Manager, seleccione O&M. En el panel de navegación de la izquierda, elija Log > Download.
- Expanda la lista desplegable Service y seleccione HBase para el clúster de destino.
- Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
- Póngase en contacto con y proporcione los registros recopilados.
Eliminación de alarmas
Esta alarma se borra automáticamente después de rectificar la falla.
Información relacionada
Ninguna