Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Centro de ayuda/ MapReduce Service/ Guía del usuario/ Referencia de alarma (aplicable a MRS 3.x)/ ALM-24009 El tiempo de recolección de basura (GC) del Flume Server supera el umbral
Actualización más reciente 2023-11-20 GMT+08:00

ALM-24009 El tiempo de recolección de basura (GC) del Flume Server supera el umbral

Descripción

El sistema comprueba la duración de GC del proceso de Flume cada 60 segundos. Esta alarma se genera cuando la duración de GC del proceso de Flume supera el umbral (12 segundos por defecto) durante cinco veces consecutivas. Esta alarma se borra cuando la duración de GC es menor que el umbral.

Atributo

ID de alarma

Gravedad de la alarma

Borrar automáticamente

24009

Importante

Parámetros

Nombre

Significado

Source

Especifica el clúster para el que se genera la alarma.

ServiceName

Especifica el servicio para el que se genera la alarma.

RoleName

Especifica el rol para el que se genera la alarma.

HostName

Especifica el host para el que se genera la alarma.

Trigger Condition

Especifica el umbral para activar la alarma.

Impacto en el sistema

La eficiencia de transmisión de datos de Flume disminuye.

Causas posibles

La memoria heap del proceso Flume se usa en exceso o se asigna de forma inadecuada, lo que provoca la ocurrencia frecuente del proceso de GC.

Procedimiento

Comprobar la duración del GC.

  1. Inicie sesión en el FusionInsight Manager y elija O&M. En el panel de navegación de la izquierda, elija Alarm > Alarms. En la página que se muestra, busque la fila que contiene GC Duration Exceeds the Threshold y vea la información del Location. Compruebe el nombre del host para el que se genera la alarma.
  2. En FusionInsight Manager, seleccione Cluster > Name of the target cluster > Services > Flume. En la página que se muestra, haga clic en la pestaña Instance. En la pestaña mostrada, seleccione el rol correspondiente al nombre de host para el que se genera la alarma y seleccione Customize en la lista desplegable en la esquina superior derecha del área del gráfico. Elija Agent y seleccione Garbage Collection (GC) Duration of Flume. A continuación, haga clic en OK.

    Figura 1 Duración de Recolección de Basura (GC) de Flume

  3. Compruebe si la duración de GC del proceso de Flume recopilado cada minuto supera el umbral (12 segundos por defecto).

    • En caso afirmativo, vaya a 4.
    • Si no, vaya a 6.

  4. En FusionInsight Manager, seleccione Cluster > Name of the desired cluster > Service > Flume > Configuration. En la página que se muestra, haga clic en All Configurations y elija Flume > System. Establezca -Xmx en el parámetro GC_OPTS a un valor mayor según los requisitos del sitio y guarde la configuración.

    Si se genera esta alarma, la memoria heap configurada para el Flume server es insuficiente para la transmisión de datos. Se recomienda cambiar la memoria heap a: Capacidad del canal x Tamaño máximo de un solo registro de datos x Número de canales. Tenga en cuenta que el valor de xmx no puede exceder la memoria restante del nodo.

  5. Reinicie los servicios o instancias afectados y compruebe si la alarma está desactivada.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 6.

Recopilar información de fallas.

  1. En FusionInsight Manager, seleccione O&M. En el panel de navegación de la izquierda, elija Log > Download.
  2. Expanda la lista desplegable Service y seleccione Flume para el clúster de destino.
  3. Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
  4. Póngase en contacto con y proporcione los registros recopilados.

Eliminación de alarmas

Esta alarma se borra automáticamente después de rectificar la falla.

Información relacionada

Ninguna