Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Centro de ayuda> MapReduce Service> Guía del usuario> Referencia de alarma (aplicable a MRS 3.x)> ALM-19021 El uso de RegionServer handler supera el umbral
Actualización más reciente 2023-11-20 GMT+08:00

ALM-19021 El uso de RegionServer handler supera el umbral

Descripción

El sistema comprueba el uso del handler de RegionServer de cada instancia de servicio HBase cada 30 segundos. Esta alarma se genera cuando el uso del handler de un RegionServer excede el umbral (90% durante cinco veces consecutivas por defecto). Esta alarma se borra si el uso del handler es inferior o igual al umbral.

Esta sección se aplica a MRS 3.2.0 o posterior.

Atributo

ID de alarma

Severidad de alarma

Borrar automáticamente

19021

Grave

Parámetros

Nombre

Significado

Source

Especifica el clúster para el que se genera la alarma.

ServiceName

Especifica el servicio para el que se genera la alarma.

RoleName

Especifica el rol para el que se genera la alarma.

HostName

Especifica el host para el que se genera la alarma.

Trigger Condition

Especifica el umbral para activar la alarma.

Impacto en el sistema

RegionServers y HBase no pueden proporcionar servicios correctamente.

Causas posibles

  • El valor de un handler es demasiado pequeño.
  • Se produce hotspotting.

Procedimiento

Ver información de ubicación de alarma.

  1. Inicie sesión en FusionInsight Manager y elija O&M. En el panel de navegación de la izquierda, elija Alarm > Alarms, busque la fila que contiene la alarma cuyo Alarm ID es 19021, y vea la instancia de servicio y el nombre de host en Location.

Comprobar la configuración de handler.

  1. Elija Cluster > Services > HBase y haga clic en la pestaña Configurations. En la esquina superior derecha de la página, busque hbase.regionserver.handler.count y compruebe si su valor es demasiado pequeño. El valor predeterminado es 200.

    • En caso afirmativo, vaya a 3.
    • Si no, vaya a 5.

  2. Cambie el valor de este parámetro a un valor mayor y guarde la configuración. Elija Cluster > Services > HBase, haga clic en la pestaña Instance, seleccione las instancias de RegionServer afectadas y elija More > Instance Rolling Restart. En el cuadro de diálogo que se muestra, escriba el nombre de usuario y la contraseña. En el cuadro de diálogo Instance Rolling Restart, haga clic en OK y espere hasta que se complete el reinicio continuo.
  3. Después de que la configuración surta efecto, compruebe si la alarma está borrada.

    • En caso afirmativo, no es necesario hacer nada más.
    • Si no, vaya a 5.

Compruebe si se produce hotspotting en el clúster.

  1. En FusionInsight Manager, elija Cluster > Services > HBase y haga clic en HMaster(Active) después de HMaster WebUI para ir a la interfaz de usuario web de la instancia de HBase. En el área Region Servers de la página Home, haga clic en Requests y compruebe si las solicitudes de las columnas Filtered Read Request Count y Write Request Count están distribuidas uniformemente.

    • En caso afirmativo, vaya a 13.
    • Si no, vaya a 6.

  2. Compruebe si las regiones están distribuidas uniformemente.

    En FusionInsight Manager, elija Cluster > Services > HBase y haga clic en HMaster(Active) después de HMaster WebUI para ir a la interfaz de usuario web de la instancia de HBase. En el área Region Servers de la página Home, haga clic en Base Stats y compruebe si las regiones de la columna Num.Regions están distribuidas uniformemente.

    • En caso afirmativo, vaya a 13.
    • Si no, vaya a 7.

  3. Inicie sesión en el nodo RegionServer defectuoso como usuario omm.
  4. Ejecute los siguientes comandos para ir al directorio de instalación del cliente y establecer la variable de entorno:

    cd Client installation directory

    source bigdata_env

    Si el clúster utiliza el modo de seguridad, ejecute el siguiente comando para realizar la autenticación de seguridad:

    kinit hbase

    Ingrese la contraseña como se le solicite (obtenga la contraseña del administrador del clúster de MRS).

  5. Ejecute los siguientes comandos para comprobar si la función de balanceo de carga está habilitada. Si la salida del comando es true, se activa la función de balanceo de carga.

    hbase shell

    balancer_enabled

    hbase:004:0> balancer_enabled
    true
    Took 0.0165 seconds
    => true
    • En caso afirmativo, vaya a 13.
    • Si no, vaya a 10.

  6. Ejecute los siguientes comandos en HBase Shell para habilitar la función de balanceo de carga y comprobar si la función está habilitada.

    balance_switch true

    balancer_enabled

    Se recomienda habilitar y activar manualmente la función de balanceo de carga durante las horas no pico.

  7. Ejecute el siguiente comando para activar manualmente la función de balanceo de carga:

    balancer

  8. Una vez finalizado el balanceo de carga, inicie sesión en FusionInsight Manager y elija O&M. En el panel de navegación de la izquierda, elija Alarm > Alarms y compruebe si la alarma está desactivada.

    • En caso afirmativo, no es necesario hacer nada más.
    • Si no, vaya a 13.

Recopilar información de fallas.

  1. En FusionInsight Manager, seleccione O&M. En el panel de navegación de la izquierda, elija Log > Download.
  2. Expanda la lista desplegable Service y seleccione HBase para el clúster de destino.
  3. Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas respectivamente. A continuación, haga clic en Download.
  4. Póngase en contacto con y proporcione los registros recopilados.

Eliminación de alarmas

Esta alarma se borra automáticamente después de rectificar la falla.

Información relacionada

Ninguna