ALM-13009 El uso de la capacidad de Znode de ZooKeeper supera el umbral
Descripción
El sistema comprueba el estado de ZNode de nivel 2 en el directorio de datos ZooKeeper cada hora. Esta alarma se genera cuando el sistema detecta que el uso de capacidad excede el umbral.
Atributo
ID de alarma |
Gravedad de la alarma |
Borrar automáticamente |
---|---|---|
13009 |
Importante |
Sí |
Parámetros
Nombre |
Significado |
---|---|
Source |
Especifica el clúster para el que se genera la alarma. |
ServiceName |
Especifica el servicio para el que se genera la alarma. |
ServiceDirectory |
Especifica el directorio para el que se genera la alarma. |
RoleName |
Especifica el rol para el que se genera la alarma. |
Trigger Condition |
Especifica el umbral para activar la alarma. |
Impacto en el sistema
Se escribe una gran cantidad de datos en el directorio de datos de ZooKeeper. Como resultado, ZooKeeper no puede proporcionar los servicios correctamente.
Causas posibles
- Se ha escrito un gran volumen de datos en el directorio de datos de ZooKeeper.
- El umbral está definido incorrectamente.
Procedimiento
Compruebe si se escribe un gran volumen de datos en el directorio de alarmas.
- En FusionInsight Manager, seleccione O&M. En el panel de navegación de la izquierda, elija Alarm > Alarms. Haga clic en la lista desplegable de la fila que contiene ALM-13009 ZooKeeper ZNode Capacity Usage Exceeds the Threshold y busque el ZNode para el que se genera la alarma en el área Location.
- Elija Cluster > Services > ZooKeeper. En la página que se muestra, haga clic en la pestaña Resource. En el área Used Resources (By Second-Level ZNode), haga clic en By capacity y compruebe si se escribe una gran cantidad de datos en el directorio de ZNode de nivel superior.
- Compruebe si se pueden eliminar los datos del directorio.
Eliminar datos de ZooKeeper es una operación de alto riesgo. Tenga cuidado cuando realice esta acción.
- Inicie sesión en el cliente ZooKeeper y elimine los datos innecesarios del directorio en el que se escribe una gran cantidad de datos.
- Inicie sesión en el directorio de instalación del cliente ZooKeeper por ejemplo, y configure las variables de entorno.
source bigdata_env
- Ejecute el siguiente comando para autenticar al usuario (omita este paso para un clúster en modo normal):
- Ejecute el siguiente comando para iniciar sesión en la herramienta de cliente:
zkCli.sh -server <Service IP address of the node where any ZooKeeper instance resides>:<Client port>
- Ejecute el siguiente comando para eliminar datos innecesarios:
- Inicie sesión en el directorio de instalación del cliente ZooKeeper por ejemplo, y configure las variables de entorno.
- Inicie sesión en FusionInsight Manager y elija Cluster > Services > ZooKeeper. En la página que se muestra, haga clic en la pestaña Configuration, luego en la subpestaña All Configurations y busque max.data.size. El valor de max.data.size es la cuota de capacidad máxima del directorio ZooKeeper. La unidad es byte. Busque el elemento de configuración GC_OPTS y compruebe el valor de Xmx.
- Compare los valores de max.data.size y Xmx*0.65. El umbral es el valor más pequeño multiplicado por 80%. Puede cambiar los valores de max.data.size y Xmx*0.65 para aumentar el umbral.
- Verifique si la alarma se ha borrado.
- En caso afirmativo, no es necesario hacer nada más.
- Si no, vaya a 8.
Recopilar información de fallas.
- En FusionInsight Manager, seleccione O&M. En el panel de navegación de la izquierda, elija Log > Download.
- Expanda la lista desplegable Service y seleccione ZooKeeper para el clúster de destino.
- Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
- Póngase en contacto con y proporcione los registros recopilados.
Eliminación de alarmas
Esta alarma se borra automáticamente después de rectificar la falla.
Información relacionada
Ninguna