Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Centro de ayuda/ MapReduce Service/ Guía del usuario/ Referencia de alarma (aplicable a MRS 3.x)/ ALM-43007 El uso de memoria no heap del proceso JobHistory2x supera el umbral
Actualización más reciente 2023-11-20 GMT+08:00

ALM-43007 El uso de memoria no heap del proceso JobHistory2x supera el umbral

Descripción

El sistema comprueba el estado del proceso JobHistory2x cada 30 segundos. La alarma se genera cuando el uso de memoria sin pila de un proceso JobHistory2x excede el umbral (95% de la memoria máxima).

Atributo

ID de alarma

Gravedad de la alarma

Borrar automáticamente

43007

Importante

Parámetros

Nombre

Significado

Source

Especifica el clúster para el que se genera la alarma.

ServiceName

Especifica el nombre del servicio para el que se genera la alarma.

RoleName

Especifica el nombre del rol para el que se genera la alarma.

HostName

Especifica el objeto (ID de host) para el que se genera la alarma.

Trigger Condition

Especifica el umbral que activa la alarma. Si el valor del indicador actual excede este umbral, se genera la alarma.

Impacto en el sistema

Si la memoria no heap de JobHistory2x Process disponible es insuficiente, se produce un desbordamiento de memoria y el servicio se rompe.

Causas posibles

La memoria no heap del proceso JobHistory2x se utiliza en exceso o la memoria no heap se asigna de forma inadecuada.

Procedimiento

Verificar el uso de memoria no heap.

  1. En el portal del FusionInsight Manager, seleccione O&M > Alarm > Alarms and select the alarm whose ID is 43007. Compruebe el RoleName en Location y confirme la dirección IP de HostName.
  2. En el portal del Administrador FusionInsight, elija Cluster > Name of the desired cluster > Services > Spark2x > Instance y haga clic en JobHistory2x para el que se genera la alarma para ir a la página Dashboard. Haga clic en el menú desplegable en el área Gráfico y elija Customize > Memory > JobHistory2x Memory Usage Statistics en el cuadro de lista desplegable en la esquina superior derecha y haga clic en OK. Compruebe si la memoria no heap utilizada del proceso JobHistory2x alcanza el umbral (el valor predeterminado es 95%) de la memoria máxima no heap especificada para JobHistory2x.

    • En caso afirmativo, vaya a 3.
    • Si no, vaya a 7.
    Figura 1 Estadísticas de uso de memoria de JobHistory2x

  3. En la página de inicio del FusionInsight Manager, seleccione Cluster > Name of the desired cluster > Services > Spark2x > Instance. Haga clic en JobHistory2x por la que se informa que la alarma va a la página Dashboard y haga clic en la lista desplegable en la esquina superior derecha del área del gráfico, elija Customize > Memory > Statistics for the non-heap memory of the JobHistory2x Process y haga clic en OK. Basado en el tiempo de generación de alarma, compruebe los valores de la memoria no heap utilizada del proceso JobHistory2x en el período correspondiente y obtenga el valor máximo.

    Figura 2 Estadísticas para la memoria no heap del proceso JobHistory2x

  4. En el portal de FusionInsight Manager, elija Cluster > Name of the desired cluster > Services > Spark2x > Configurations y haga clic en All Configurations. Elija JobHistory2x > Default. Puede cambiar el valor de -XX:MaxMetaspaceSize en SPARK_DAEMON_JAVA_OPTS de acuerdo con las siguientes reglas: Proporción del uso de memoria no heap de JobHistory2x con el umbral de estadísticas de uso de memoria no heap de JobHistory2x Non-Heap Memory Usage Statistics (JobHistory2x) en el período de alarma.

    En la página de inicio del FusionInsight Manager, elija O&M > Alarm > Thresholds > Name of the desired cluster > Spark2x > Memory >JobHistory2x Non-Heap Memory Usage Statistics (JobHistory2x) para ver Threshold.

  5. Reinicie todas las instancias de JobHistory2x.
  6. Después de 10 minutos, compruebe si la alarma está borrada.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 7.

Recopilar información de fallas.

  1. En el portal del FusionInsight Manager, elija O&M > Log > Download.
  2. Seleccione Spark2x en el clúster requerido en el Service.
  3. Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
  4. Póngase en contacto con el y envíe los registros recopilados.

Eliminación de alarmas

Después de rectificar la falla, el sistema borra automáticamente esta alarma.

Información relacionada

Ninguna