ALM-19013 La duración de las regiones en estado de transacción supera el umbral
Descripción
El sistema comprueba el número de regiones en estado de transacción en HBase cada 300 segundos. Esta alarma se genera cuando el sistema detecta que la duración de las regiones en estado de transacción excede el umbral durante dos veces consecutivas. Esta alarma se borra cuando se restauran todas las regiones de tiempo de espera.
Atributo
ID de alarma |
Gravedad de la alarma |
Borrado automáticamente |
---|---|---|
19013 |
Importante |
Sí |
Parámetros
Nombre |
Significado |
---|---|
Source |
Especifica el clúster para el que se genera la alarma. |
ServiceName |
Especifica el servicio para el que se genera la alarma. |
RoleName |
Especifica el rol para el que se genera la alarma. |
HostName |
Especifica el host para el que se genera la alarma. |
Impacto en el sistema
Algunos datos de la tabla se pierden o no están disponibles.
Causas posibles
- La compactación está permanentemente bloqueada.
- Los archivos HDFS son anormales.
Procedimiento
Localizar la causa de la alarma.
- En FusionInsight Manager, elija O&M > Alarm > Alarms, seleccione esta alarma y vea HostName y RoleName en Location.
- Elija Cluster > Name of the desired cluster > Services > HBase, haga clic en el menú desplegable en el área de gráfico y elijaCustomize > Service >
Region in transaction count para ver Region in transaction count over threshold. Compruebe si el elemento de supervisión detecta un valor en tres períodos de detección consecutivos. (El umbral predeterminado es 60 segundos.)Figura 1 Region in transaction count
- Seleccione Cluster > Name of the desired cluster > Services > HBase > HMaster (Active) > Tables para comprobar si las regiones de un solo estado de transacción de tabla se agotan.
Figura 2 Tablas
- Ejecute el comando hbase hbck en el cliente y compruebe si se muestra el mensaje de error "No table descriptor file under hdfs://hacluster/hbase/data/default/table".
- Inicie sesión en el cliente como usuario root. Ejecute el siguiente comando:
cd client installation directory
source bigdata_env
Si el clúster está en modo de seguridad, ejecute el comando kinit hbase
Inicie sesión en HMaster WebUI, seleccione Procedure & Locks en el árbol de navegación y compruebe si algún ID de proceso está en el estado Waiting en Procedures. En caso afirmativo, ejecute el siguiente comando para liberar el bloqueo de procedimiento:
hbase hbck -j client installation directory/HBase/hbase/tools/hbase-hbck2-*.jar bypass -o pid
Compruebe si el estado está en el estado Bypass. Si el procedimiento en la interfaz de usuario está siempre en estado RUNNABLE(Bypass), realice una conmutación activa/en espera. Ejecute el comando assigns para volver a conectar la región.
hbase hbck -j client installation directory/HBase/hbase/tools/hbase-hbck2-*.jar assigns -o regionName
- Repita 4. Ejecute el comando hbase hbck en el cliente y compruebe si se muestra el mensaje de error "No table descriptor file under hdfs://hacluster/hbase/data/default/table".
- En caso afirmativo, vaya a 7.
- En caso negativo, no se requiere ninguna otra acción.
Recopilar información de fallas.
- En la página FusionInsight Manager de los clústeres activo y en espera, seleccione O&M > Log > Download.
- En el área Service, seleccione los servicios HBase defectuosos en el clúster requerido.
- Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
- Póngase en contacto con el y envíe los registros recopilados.
Eliminación de alarmas
Después de rectificar la falla, el sistema borra automáticamente esta alarma.
Información relacionada
Ninguna