ALM-19021 El uso de RegionServer handler supera el umbral
Descripción
El sistema comprueba el uso del handler de RegionServer de cada instancia de servicio HBase cada 30 segundos. Esta alarma se genera cuando el uso del handler de un RegionServer excede el umbral (90% durante cinco veces consecutivas por defecto). Esta alarma se borra si el uso del handler es inferior o igual al umbral.
Esta sección se aplica a MRS 3.2.0 o posterior.
Atributo
ID de alarma |
Severidad de alarma |
Borrar automáticamente |
---|---|---|
19021 |
Grave |
Sí |
Parámetros
Nombre |
Significado |
---|---|
Source |
Especifica el clúster para el que se genera la alarma. |
ServiceName |
Especifica el servicio para el que se genera la alarma. |
RoleName |
Especifica el rol para el que se genera la alarma. |
HostName |
Especifica el host para el que se genera la alarma. |
Trigger Condition |
Especifica el umbral para activar la alarma. |
Impacto en el sistema
RegionServers y HBase no pueden proporcionar servicios correctamente.
Causas posibles
- El valor de un handler es demasiado pequeño.
- Se produce hotspotting.
Procedimiento
Ver información de ubicación de alarma.
- Inicie sesión en FusionInsight Manager y elija O&M. En el panel de navegación de la izquierda, elija Alarm > Alarms, busque la fila que contiene la alarma cuyo Alarm ID es 19021, y vea la instancia de servicio y el nombre de host en Location.
Comprobar la configuración de handler.
- Elija Cluster > Services > HBase y haga clic en la pestaña Configurations. En la esquina superior derecha de la página, busque hbase.regionserver.handler.count y compruebe si su valor es demasiado pequeño. El valor predeterminado es 200.
- Cambie el valor de este parámetro a un valor mayor y guarde la configuración. Elija Cluster > Services > HBase, haga clic en la pestaña Instance, seleccione las instancias de RegionServer afectadas y elija More > Instance Rolling Restart. En el cuadro de diálogo que se muestra, escriba el nombre de usuario y la contraseña. En el cuadro de diálogo Instance Rolling Restart, haga clic en OK y espere hasta que se complete el reinicio continuo.
- Después de que la configuración surta efecto, compruebe si la alarma está borrada.
- En caso afirmativo, no es necesario hacer nada más.
- Si no, vaya a 5.
Compruebe si se produce hotspotting en el clúster.
- En FusionInsight Manager, elija Cluster > Services > HBase y haga clic en HMaster(Active) después de HMaster WebUI para ir a la interfaz de usuario web de la instancia de HBase. En el área Region Servers de la página Home, haga clic en Requests y compruebe si las solicitudes de las columnas Filtered Read Request Count y Write Request Count están distribuidas uniformemente.
- Compruebe si las regiones están distribuidas uniformemente.
En FusionInsight Manager, elija Cluster > Services > HBase y haga clic en HMaster(Active) después de HMaster WebUI para ir a la interfaz de usuario web de la instancia de HBase. En el área Region Servers de la página Home, haga clic en Base Stats y compruebe si las regiones de la columna Num.Regions están distribuidas uniformemente.
- Inicie sesión en el nodo RegionServer defectuoso como usuario omm.
- Ejecute los siguientes comandos para ir al directorio de instalación del cliente y establecer la variable de entorno:
cd Client installation directory
source bigdata_env
Si el clúster utiliza el modo de seguridad, ejecute el siguiente comando para realizar la autenticación de seguridad:
kinit hbase
Ingrese la contraseña como se le solicite (obtenga la contraseña del administrador del clúster de MRS).
- Ejecute los siguientes comandos para comprobar si la función de balanceo de carga está habilitada. Si la salida del comando es true, se activa la función de balanceo de carga.
hbase shell
balancer_enabled
hbase:004:0> balancer_enabled true Took 0.0165 seconds => true
- Ejecute los siguientes comandos en HBase Shell para habilitar la función de balanceo de carga y comprobar si la función está habilitada.
balance_switch true
balancer_enabled
Se recomienda habilitar y activar manualmente la función de balanceo de carga durante las horas no pico.
- Ejecute el siguiente comando para activar manualmente la función de balanceo de carga:
balancer
- Una vez finalizado el balanceo de carga, inicie sesión en FusionInsight Manager y elija O&M. En el panel de navegación de la izquierda, elija Alarm > Alarms y compruebe si la alarma está desactivada.
- En caso afirmativo, no es necesario hacer nada más.
- Si no, vaya a 13.
Recopilar información de fallas.
- En FusionInsight Manager, seleccione O&M. En el panel de navegación de la izquierda, elija Log > Download.
- Expanda la lista desplegable Service y seleccione HBase para el clúster de destino.
- Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas respectivamente. A continuación, haga clic en Download.
- Póngase en contacto con y proporcione los registros recopilados.
Eliminación de alarmas
Esta alarma se borra automáticamente después de rectificar la falla.
Información relacionada
Ninguna