Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Centro de ayuda> MapReduce Service> Guía del usuario> Referencia de alarma (aplicable a MRS 3.x)> ALM-19014 El uso de la cuota de capacidad en el ZooKeeper supera severamente el umbral
Actualización más reciente 2023-11-20 GMT+08:00

ALM-19014 El uso de la cuota de capacidad en el ZooKeeper supera severamente el umbral

Descripción

El sistema comprueba el uso de ZNode del servicio HBase cada 120 segundos. Esta alarma se genera cuando el uso de capacidad ZNode del servicio HBase excede el umbral de alarma crítica (90% por defecto).

Esta alarma se borra cuando el uso de capacidad ZNode es menor que el umbral de alarma crítica.

Atributo

ID de alarma

Gravedad de la alarma

Borrar automáticamente

19014

Crítica

Parámetros

Nombre

Significado

Source

Especifica el clúster para el que se genera la alarma.

ServiceName

Especifica el servicio para el que se genera la alarma.

RoleName

Especifica el rol para el que se genera la alarma.

HostName

Especifica el host para el que se genera la alarma.

Threshold

Especifica el umbral para el que se genera la alarma.

Impacto en el sistema

Esta alarma indica que el uso de capacidad del ZNode de HBase ha excedido severamente el umbral. Como resultado, la solicitud de escritura del servicio HBase falla.

Causas posibles

  • La DR está configurada para HBase y la sincronización de datos falla o es lenta en la DR.
  • Se está dividiendo un gran número de archivos WAL en el clúster HBase.

Procedimiento

Verificar la configuración de capacidad y el uso de ZNodes.

  1. En FusionInsight Manager, seleccione O&M > Alarm > Alarms, seleccione la alarma cuyo ID es 19014 y vea el umbral en Additional Information.
  2. Inicie sesión en el cliente HBase como usuario root. Ejecute el siguiente comando para ir al directorio de instalación del cliente:

    cd Client installation directory

    Ejecute el siguiente comando para establecer variables de entorno:

    source bigdata_env

    Si el clúster utiliza el modo de seguridad, ejecute el siguiente comando para realizar la autenticación de seguridad:

    kinit hbase

    Ingrese la contraseña como se le solicite (obtenga la contraseña del administrador del clúster de MRS).

  3. Ejecute el comando hbase zkcli para iniciar sesión en el cliente ZooKeeper y ejecute el comando listquota /hbase para comprobar la cuota de capacidad de ZNode del servicio HBase. El directorio raíz ZNode en el comando se especifica mediante el parámetro zookeeper.znode.parent del servicio HBase. El área marcada en la siguiente figura muestra la configuración de capacidad del raíz ZNode del servicio HBase.

  4. Ejecute el comando getusage /hbase/splitWAL para comprobar el uso de capacidad del ZNode. Compruebe si la relación de Data size a la cuota de capacidad de ZNode está cerca del umbral de alarma.

    • En caso afirmativo, vaya a 5.
    • Si no, vaya a 6.

  5. En FusionInsight Manager, seleccione O&M > Alarm > Alarms. Compruebe si existe la alarma cuyo ID sea 12007, 19000 o 19013 y el ServiceName de Location es el servicio HBase actual.

    • En caso afirmativo, haga clic en View Help junto a la alarma y rectifique la falla consultando el documento de ayuda. A continuación, vaya a 8.
    • Si no, vaya a 9.

  6. Ejecute el comando getusage /hbase/replication para comprobar el uso de capacidad del ZNode. Compruebe si la relación de Data size a la cuota de capacidad de ZNode está cerca del umbral de alarma.

    • En caso afirmativo, vaya a 7.
    • Si no, vaya a 9.

  7. En FusionInsight Manager, seleccione O&M > Alarm > Alarms. Compruebe si la alarma cuyo ID es 19006 y ServiceName en Location es el servicio HBase actual existe.

    • En caso afirmativo, haga clic en View Help junto a la alarma y rectifique la falla consultando el documento de ayuda. A continuación, vaya a 8.
    • Si no, vaya a 9.

  8. Compruebe si la alarma se borra cinco minutos más tarde.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 9.

Recopilar información de fallas.

  1. En FusionInsight Manager, seleccione O&M. En el panel de navegación de la izquierda, elija Log > Download.
  2. Expanda la lista desplegable junto al campo Service. En el cuadro de diálogo Services que se muestra, seleccione HBase para el clúster de destino.
  3. Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
  4. Póngase en contacto con y proporcione los registros recopilados.

Eliminación de alarmas

Esta alarma se borra automáticamente después de rectificar la falla.

Información relacionada

Ninguna