Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Centro de ayuda/ MapReduce Service/ Guía del usuario/ Referencia de alarma (aplicable a MRS 3.x)/ ALM-19013 La duración de las regiones en estado de transacción supera el umbral
Actualización más reciente 2023-11-20 GMT+08:00

ALM-19013 La duración de las regiones en estado de transacción supera el umbral

Descripción

El sistema comprueba el número de regiones en estado de transacción en HBase cada 300 segundos. Esta alarma se genera cuando el sistema detecta que la duración de las regiones en estado de transacción excede el umbral durante dos veces consecutivas. Esta alarma se borra cuando se restauran todas las regiones de tiempo de espera.

Atributo

ID de alarma

Gravedad de la alarma

Borrado automáticamente

19013

Importante

Parámetros

Nombre

Significado

Source

Especifica el clúster para el que se genera la alarma.

ServiceName

Especifica el servicio para el que se genera la alarma.

RoleName

Especifica el rol para el que se genera la alarma.

HostName

Especifica el host para el que se genera la alarma.

Impacto en el sistema

Algunos datos de la tabla se pierden o no están disponibles.

Causas posibles

  • La compactación está permanentemente bloqueada.
  • Los archivos HDFS son anormales.

Procedimiento

Localizar la causa de la alarma.

  1. En FusionInsight Manager, elija O&M > Alarm > Alarms, seleccione esta alarma y vea HostName y RoleName en Location.
  2. Elija Cluster > Name of the desired cluster > Services > HBase, haga clic en el menú desplegable en el área de gráfico y elijaCustomize > Service >

    Region in transaction count para ver Region in transaction count over threshold. Compruebe si el elemento de supervisión detecta un valor en tres períodos de detección consecutivos. (El umbral predeterminado es 60 segundos.)
    • En caso afirmativo, vaya a 3.
    • Si no, vaya a 7.
    Figura 1 Region in transaction count

  3. Seleccione Cluster > Name of the desired cluster > Services > HBase > HMaster (Active) > Tables para comprobar si las regiones de un solo estado de transacción de tabla se agotan.

    • En caso afirmativo, vaya a 4.
    • Si no, vaya a 7.
    Figura 2 Tablas

  4. Ejecute el comando hbase hbck en el cliente y compruebe si se muestra el mensaje de error "No table descriptor file under hdfs://hacluster/hbase/data/default/table".

    • En caso afirmativo, vaya a 5.
    • Si no, vaya a 7.

  5. Inicie sesión en el cliente como usuario root. Ejecute el siguiente comando:

    cd client installation directory

    source bigdata_env

    Si el clúster está en modo de seguridad, ejecute el comando kinit hbase

    Inicie sesión en HMaster WebUI, seleccione Procedure & Locks en el árbol de navegación y compruebe si algún ID de proceso está en el estado Waiting en Procedures. En caso afirmativo, ejecute el siguiente comando para liberar el bloqueo de procedimiento:

    hbase hbck -j client installation directory/HBase/hbase/tools/hbase-hbck2-*.jar bypass -o pid

    Compruebe si el estado está en el estado Bypass. Si el procedimiento en la interfaz de usuario está siempre en estado RUNNABLE(Bypass), realice una conmutación activa/en espera. Ejecute el comando assigns para volver a conectar la región.

    hbase hbck -j client installation directory/HBase/hbase/tools/hbase-hbck2-*.jar assigns -o regionName

  6. Repita 4. Ejecute el comando hbase hbck en el cliente y compruebe si se muestra el mensaje de error "No table descriptor file under hdfs://hacluster/hbase/data/default/table".

    • En caso afirmativo, vaya a 7.
    • En caso negativo, no se requiere ninguna otra acción.

Recopilar información de fallas.

  1. En la página FusionInsight Manager de los clústeres activo y en espera, seleccione O&M > Log > Download.
  2. En el área Service, seleccione los servicios HBase defectuosos en el clúster requerido.
  3. Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
  4. Póngase en contacto con el y envíe los registros recopilados.

Eliminación de alarmas

Después de rectificar la falla, el sistema borra automáticamente esta alarma.

Información relacionada

Ninguna