Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Centro de ayuda> MapReduce Service> Guía del usuario> Referencia de alarma (aplicable a MRS 3.x)> ALM-43018 Número de Full GC de proceso de JobHistory2x supera el umbral
Actualización más reciente 2023-11-20 GMT+08:00

ALM-43018 Número de Full GC de proceso de JobHistory2x supera el umbral

Descripción

El sistema comprueba el número de veces de recolección de basura completa (GC) del proceso JobHistory2x cada 60 segundos. Esta alarma se genera cuando el número de GC completo detectado supera el umbral (excede 12 durante tres comprobaciones consecutivas.) Puede cambiar el umbral seleccionando O&M > Alarm > Thresholds > Name of the desired cluster > Spark2x > GC number > Full GC Number of JobHistory2x. Esta alarma se borra cuando el número de GC completo del proceso JobHistory2x es menor o igual que el umbral.

Atributo

ID de alarma

Gravedad de la alarma

Borrar automáticamente

43018

Importante

Parámetros

Nombre

Descripción

Source

Especifica el clúster para el que se genera la alarma.

ServiceName

Especifica el servicio para el que se genera la alarma.

RoleName

Especifica el rol para el que se genera la alarma.

HostName

Especifica el host para el que se genera la alarma.

Trigger Condition

Especifica el umbral para activar la alarma.

Impacto en el sistema

El rendimiento del proceso de JobHistory2x se ve afectado, o incluso el proceso de JobHistory2x no está disponible.

Causas posibles

El uso de memoria heap del proceso JobHistory2x es excesivamente grande, o la memoria heap se asigna de forma inadecuada. Como resultado, se produce con frecuencia Full CG.

Procedimiento

Comprobar el número de Full GCs.

  1. Inicie sesión en FusionInsight Manager, seleccione O&M > Alarm > Alarms, seleccione esta alarma y compruebe el RoleName en Location y confirme la dirección IP de HostName.
  2. Elija Cluster > Name of the desired cluster > Services > Spark2x > Instance. En la página mostrada, haga clic en JobHistory2x para la que se ha informado la alarma. En la página Dashboard que se muestra, haga clic en el menú desplegable en el área Gráfico y elija Customize > GC Number > Full GC Number of JobHistory2x en la esquina superior derecha y haga clic en OK. Compruebe si el número de GC completos del proceso JobHistory2x es mayor que el umbral (valor predeterminado: 12).

    • Si lo es, vaya a 3.
    • Si no es así, vaya a 6.
    Figura 1 Número de Full GC de JobHistory2x

  3. Seleccione Cluster > Name of the desired cluster > Services > Spark2x > Configurations > All Configurations. En la página mostrada, elija JobHistory2x > Default. El valor predeterminado de SPARK_DAEMON_MEMORY es 4GB. Puede cambiar el valor de acuerdo con las siguientes reglas: Si esta alarma se genera ocasionalmente, aumente el valor en 0.5 veces. Si la alarma se informa con frecuencia, aumente el valor en 1 vez.
  4. Reinicie todas las instancias de JobHistory2x.
  5. Después de 10 minutos, compruebe si la alarma está borrada.

    • Si lo es, no se requiere ninguna otra acción.
    • Si no es así, vaya a 6.

    Recopilar información de fallas.

  6. Inicie sesión en el Administrador de FusionInsight y elija O&M > Log > Download.
  7. Seleccione Spark2x en el clúster requerido en el Service.
  8. Haga clic en en la esquina superior derecha. En el cuadro de diálogo que se muestra, establezca Start Date y End Date en 10 minutos antes y después del tiempo de generación de alarmas respectivamente y haga clic en OK. A continuación, haga clic en Download.
  9. Póngase en contacto con el y envíe los registros recopilados.

Eliminación de alarmas

Esta alarma se borrará automáticamente después de que se corrija la falla.

Información relacionada

Ninguna