Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Centro de ayuda> MapReduce Service> Guía del usuario> Referencia de alarma (aplicable a MRS 3.x)> ALM-16001 El uso del espacio en el almacén de Hive supera el umbral
Actualización más reciente 2023-11-20 GMT+08:00

ALM-16001 El uso del espacio en el almacén de Hive supera el umbral

Descripción

Esta alarma se genera cuando el uso del espacio del almacén de Hive supera el umbral especificado (85% de forma predeterminada). El sistema comprueba el uso del espacio del almacén de datos de Hive cada 30s. El indicador Porcentaje de espacio de HDFS utilizado por Hive con respecto al espacio disponible se puede ver en la página de supervisión del servicio Hive.

Para cambiar el umbral, elija O&M > Alarm > Thresholds > Name of the desired cluster > Hive > Percentage of HDFS Space Used by Hive to the Available Space.

Cuando el Trigger Count es 1, esta alarma se borra cuando el uso del espacio del almacén de Hive es menor o igual que el umbral. Cuando el Trigger Count es mayor que 1, esta alarma se borra cuando el uso del espacio del almacén de Hive es menor o igual al 90% del umbral.

El administrador puede reducir el uso del espacio del almacén mediante la ampliación de la capacidad del almacén o la liberación del espacio utilizado.

Atributo

ID de alarma

Gravedad de la alarma

Borrado automáticamente

16001

Leves

Parámetros

Nombre

Significado

Source

Especifica el clúster para el que se genera la alarma.

ServiceName

Especifica el servicio para el que se genera la alarma.

RoleName

Especifica el rol para el que se genera la alarma.

HostName

Especifica el host para el que se genera la alarma.

Trigger Condition

Especifica el umbral que activa la alarma. Si el valor del indicador actual excede este umbral, se genera la alarma.

Impacto en el sistema

El sistema no puede escribir datos, lo que causa la pérdida de datos.

Causas posibles

  • El límite superior de la capacidad HDFS disponible para Hive es demasiado pequeño.
  • El espacio HDFS es insuficiente.
  • Algunos nodos de datos se descomponen.

Procedimiento

Expandir la configuración del sistema.

  1. Analice el uso de la capacidad HDFS del clúster y aumente el límite superior de la capacidad HDFS disponible para Hive.

    Inicie sesión en el Administrador de FusionInsight, elija Cluster > Name of the desired cluster > Services > Hive > Configurations > All Configurations, find hive.metastore.warehouse.size.percent, y aumentar su valor para que una mayor capacidad de HDFS esté disponible para Hive. Supongamos que el valor del elemento de configuración es A, el espacio de almacenamiento de HDFS total es B, el umbral es C y el espacio de HDFS utilizado por Hive es D. La política de ajuste es A x B x C > D. El espacio total de almacenamiento de HDFS se puede ver en la página HDFS NameNode. El espacio HDFS utilizado por Hive se puede ver en la página de supervisión de Hive.

  2. Verifique si la alarma se ha borrado.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 3.

Expandir el sistema.

  1. Expanda el sistema.
  2. Verifique si la alarma se ha borrado.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 5.

Comprobar si el nodo de datos es normal.

  1. En el portal de Administrador de FusionInsight, haga clic en O&M > Alarm > Alarms.
  2. Compruebe si existen "ALM-12006 error de nodo", "ALM-12007 error de proceso", o "ALM-14002 uso de disco de DataNode excede el umbral".

    • En caso afirmativo, vaya a 7.
    • Si no, vaya a 9.

  3. Borre la alarma siguiendo los pasos proporcionados en "ALM-12006 error de nodo", "ALM-12007 error de proceso", y "ALM-14002 El uso del disco de DataNode supera el umbral".
  4. Verifique si la alarma se ha borrado.
  • De ser así, no se requiere ninguna acción adicional.
  • Si no, vaya a 9.

Recopilar información de fallas.

  1. En el portal del FusionInsight Manager, elija O&M > Log > Download.
  2. Seleccione Hive en el clúster requerido en el Service.
  3. Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
  4. Póngase en contacto con el y envíe los registros recopilados.

Eliminación de alarmas

Después de rectificar la falla, el sistema borra automáticamente esta alarma.

Información relacionada

Ninguna