ALM-19011 El número de región de RegionServer supera el umbral
Descripción
El sistema comprueba el número de región en cada RegionServer en cada instancia de servicio HBase cada 30 segundos. El número de región se muestra en la página de supervisión del servicio HBase y en la página de supervisión del rol RegionServer. Esta alarma se genera cuando el número de Regions en un RegionServer excede el umbral (valor predeterminado: 2000) durante 20 veces consecutivas. El umbral se puede cambiar eligiendo O&M > Alarm > Thresholds > Name of the desired cluster > HBase. Esta alarma se borra cuando el número de regiones es menor o igual que el umbral.
Atributo
ID de alarma |
Gravedad de la alarma |
Borrar automáticamente |
---|---|---|
19011 |
Importante |
Sí |
Parámetros
Nombre |
Significado |
---|---|
Source |
Especifica el clúster para el que se genera la alarma. |
ServiceName |
Especifica el servicio para el que se genera la alarma. |
RoleName |
Especifica el rol para el que se genera la alarma. |
HostName |
Especifica el host para el que se genera la alarma. |
Impacto en el sistema
El rendimiento de lectura/escritura de datos de HBase se ve afectado cuando el número de regiones en un RegionServer excede el umbral.
Causas posibles
- La distribución de región de RegionServer está desequilibrada.
- La escala del clúster HBase es demasiado pequeña.
Procedimiento
Vea información de localización de alarma.
- En la página de inicio del FusionInsight Manager, seleccione O&M > Alarm > Alarms, seleccione esta alarma y vea la instancia de servicio y el nombre del host en Location.
- En la página principal del FusionInsight Manager, seleccione Cluster > Name of the desired cluster > Services, haga clic en la instancia de servicio HBase para la que se genera la alarma y haga clic en HMaster(Active). En el WebUI mostrado de la instancia de HBase, compruebe si la distribución de región en el RegionServer está equilibrada.
De forma predeterminada, el usuario admin no tiene los permisos para gestionar otros componentes. Si la página no se puede abrir o el contenido mostrado está incompleto al acceder a la interfaz de usuario nativa de un componente debido a la falta de permisos, puede crear manualmente un usuario con los permisos para gestionar ese componente.
Habilitar balanceo de carga.
- Inicie sesión en el nodo donde se encuentra el cliente HBase como usuario root. Vaya al directorio de instalación del cliente y establezca las variables de entorno.
cd client installation directory
source bigdata_env
Si el clúster adopta el modo de seguridad, realice la autenticación de seguridad. Específicamente, ejecute el comando kinit hbase e introduzca la contraseña como se le solicite (obtenga la contraseña del administrador).
- Ejecute los siguientes comandos para ir a la ventana de comandos del shell de HBase y verifique si la función de balanceo de carga está habilitada.
hbase shell
balancer_enabled
- En la ventana de comandos del shell de HBase, ejecute los siguientes comandos para habilitar la función de balanceo de carga y compruebe si la función está habilitada.
balance_switch true
balancer_enabled
- En la ventana de comandos del shell HBase, ejecute el comando balancer para activar manualmente la función de balanceo de carga.
Se recomienda habilitar y activar manualmente la función de balanceo de carga durante las horas no pico.
- En la página de inicio del FusionInsight Manager, elija Cluster > Name of the desired cluster > Services > HBase y haga clic en HMaster(Active). En la WebUI mostrada de la instancia de HBase, actualice la página y compruebe si la distribución de región está equilibrada.
- Verifique si la alarma se ha borrado.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 9.
Eliminar tablas no deseadas de HBase.
Tenga cuidado al eliminar datos para asegurarse de que los datos se eliminen correctamente.
- En la página de inicio del FusionInsight Manager, elija Cluster > Name of the desired cluster > Services > HBase y haga clic en HMaster(Active). En la WebUI mostrada de la instancia de HBase, vea las tablas almacenadas en la instancia de servicio de HBase y registre las tablas no deseadas que se puedan eliminar.
- En la ventana de comandos del shell HBase, ejecute el comando disable y el comando drop para eliminar la tabla y reducir el número de Regions.
disable 'name of the table to be deleted'
drop 'name of the table to be deleted'
- En la ventana de comandos del shell de HBase, ejecute el siguiente comando para comprobar si la función de balanceo de carga está habilitada.
- En la ventana de comandos del shell de HBase, ejecute los siguientes comandos para habilitar la función de balanceo de carga y confirmar que la función está habilitada.
balance_switch true
balancer_enabled
- En la ventana de comandos del shell HBase, ejecute el comando balancer para activar manualmente la función de balanceo de carga.
- En la página de inicio del FusionInsight Manager, elija Cluster > Name of the desired cluster > Services > HBase y haga clic en HMaster(Active). En la WebUI mostrada de la instancia de HBase, actualice la página y compruebe si la distribución de región está equilibrada.
- Verifique si la alarma se ha borrado.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 16.
Ajustar el umbral.
- En la página de inicio del FusionInsight Manager, elija O&M > Alarm > Thresholds > Name of the desired cluster > HBase > Regions(RegionServer) y seleccione la regla aplicada y haga clic en Modify para comprobar si el umbral es correcto.
- Si es excesivamente pequeño, aumente el umbral según sea necesario y vaya a 17.
- Si es apropiado, diríjase a 18.
Figura 1 Regions(RegionServer_1)
- Verifique si la alarma se ha borrado.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 18.
Realizar expansión de capacidad de sistema.
- Agregue nodos al clúster de HBase y agregue instancias de RegionServer a los nodos. A continuación, habilite y active manualmente la función de balanceo de carga.
- En la página principal del FusionInsight Manager, seleccione Cluster > Name of the desired cluster > Services, haga clic en la instancia de servicio HBase para la que se genera la alarma y haga clic en HMaster(Active). En la WebUI mostrada de la instancia de HBase, actualice la página y compruebe si la distribución de región está equilibrada.
- Verifique si la alarma se ha borrado.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 21.
Recopilar información de fallas.
- En la página principal del FusionInsight Manager de los clústeres activo y en espera, seleccione O&M> Log > Download.
- Seleccione HBase en el clúster requerido en el Service.
- Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
- Póngase en contacto con el y envíe los registros recopilados.
Eliminación de alarmas
Después de rectificar la falla, el sistema borra automáticamente esta alarma.
Información relacionada
Ninguna