Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Actualización más reciente 2024-06-12 GMT+08:00

Gestión de alarma

Descripción

La gestión de alarmas incluye la visualización y configuración de reglas de alarma y la suscripción a la información de alarma. Las reglas de alarma muestran estadísticas de alarmas y detalles de la semana pasada para que los usuarios vean las alarmas del tenant. Además de proporcionar un conjunto de reglas de alarma de GaussDB(DWS) predeterminadas, esta característica le permite modificar los umbrales de alarma basados en sus propios servicios. Las notificaciones de alarma de GaussDB(DWS) se envían utilizando el servicio SMN.

  • Esta característica solo admite el núcleo de base de datos de 8.1.1.200 y posteriores.
  • Actualmente, las alarmas no se pueden clasificar y gestionar por proyecto de empresa.

Visita la página de alarmas

  1. Inicie sesión en la consola de gestión de GaussDB(DWS).
  2. En el panel de navegación de la izquierda, haga clic en Alarms.
  3. Vaya a la página de alarma del almacén de datos. Esta página está dividida en tres áreas:

    • Estadísticas de alarma existentes

      Las estadísticas de las alarmas existentes en los últimos siete días se muestran por gravedad de alarma en un gráfico de barras. De esta manera, se puede ver claramente el número y la categoría de las alarmas generadas en la última semana.

    • Alarmas de hoy

      Las estadísticas de las alarmas existentes en el día actual se muestran por gravedad de alarma en una lista. De esta manera, se puede ver claramente el número y la categoría de las alarmas no manejadas generadas en el día.

    • Detalles de la alarma

      Los detalles sobre todas las alarmas, manejadas y no controladas, en los últimos siete días se muestran en una tabla para que pueda localizar rápidamente los errores, incluido el nombre de la alarma, la gravedad de la alarma, el nombre del clúster, la ubicación, la descripción, la fecha de generación y el estado.

    Los datos de alarma mostrados (un máximo de 30 días) son compatibles con el Event Service microservice.

Tipos de alarmas y alarmas

Tabla 1 Alarmas de umbral de fuentes de alarma DMS

Tipo

Nombre

Severidad

Descripción

Predeterminado

El uso de la CPU del nodo supera el umbral

Urgente

Esta alarma se genera si el umbral de uso de CPU (sistema + usuario) de cualquier nodo en el clúster se excede dentro del período especificado y no se cumple la restricción. La alarma se borrará cuando el uso de CPU (sistema + usuario) sea inferior al umbral y no se cumpla la restricción.

Predeterminado

El uso del disco de datos del nodo supera el umbral

Urgente: > 85%; Importante: > 80%

Esta alarma se genera si el umbral de uso del disco de datos (/var/chroot/DWS/data[n]) de cualquier nodo en el clúster se excede dentro del período especificado y no se cumple la restricción. La alarma se borrará cuando el uso del disco de datos (/var/chroot/DWS/data[n]) sea menor que el umbral y no se cumpla la restricción.

Predeterminado

El uso de E/S del disco de datos del nodo supera el umbral

Urgente

Esta alarma se genera si el umbral de uso de E/S (util) de disco de datos (/var/chroot/DWS/data[n]) de cualquier nodo en el clúster se excede dentro del período especificado y no se cumple la restricción. La alarma se borrará cuando el uso de E/S (util) del disco de datos (/var/chroot/DWS/data[n]) sea inferior al umbral y no se cumpla la restricción.

Predeterminado

La latencia del disco de datos de nodo supera el umbral

Importante

Esta alarma se genera si el umbral de latencia de E/S (await) del disco de datos (/var/chroot/DWS/data[n]) de cualquier nodo del clúster se excede dentro del período especificado y no se cumple la restricción. La alarma se borrará cuando la latencia de E/S (await) del disco de datos (/var/chroot/DWS/data[n]) sea menor que el umbral y no se cumpla la restricción.

Predeterminado

El uso del Inode del disco de datos del nodo supera el umbral

Urgente: > 95%; importante: > 90%

Esta alarma se genera si el umbral del uso del inode del disco de datos (/var/chroot/DWS/data[n]) de cualquier nodo del clúster se excede dentro del período especificado y no se cumple la restricción. La alarma se borrará cuando el uso del inode del disco de datos (/var/chroot/DWS/data[n]) sea inferior al umbral y no se cumpla la restricción.

Predeterminado

Los datos vaciados en discos de la sentencia de consulta superan el umbral

Urgente

Esta alarma se genera si el umbral de datos vaciados en discos de la sentencia SQL en el clúster se supera dentro del período especificado y no se cumple la restricción. La alarma solo se puede borrar después de que usted maneje la sentencia SQL.

Predeterminado

El número de sentencias de consulta de cola supera el umbral

Urgente

Esta alarma se genera si se excede el umbral del número de sentencias SQL en cola dentro del período especificado. La alarma se borrará cuando el número de sentencias SQL en cola sea menor que el umbral.

Predeterminado

Congestión de colas en el grupo de recursos predeterminado del clúster

Urgente

Esta alarma se genera si la cola en el grupo de recursos predeterminado de un clúster está congestionada y no se cumplen las condiciones de supresión de alarma. Esta alarma se borrará si la cola no está congestionada.

Predeterminado

La tasa de retransmisión de pérdida de paquetes en la red del clúster supera el umbral.

Urgente

Esta alarma se genera si el módulo de alarma DMS detecta una alta tasa de retransmisión en un servidor y no se cumplen condiciones de supresión de alarma. Si la velocidad de retransmisión disminuye, la alarma se borrará automáticamente.

Predeterminado

Duración larga de la ejecución de la sonda SQL en un clúster

Urgente

Esta alarma se genera si el módulo de alarma DMS detecta una duración de ejecución de sonda SQL en un servidor y no se cumplen condiciones de supresión de alarma. Si ninguna duración de ejecución supera el umbral, la alarma se borrará automáticamente.

NOTA:

La alarma solo se admite en 8.1.1.300 y versiones de clúster posteriores. Para versiones anteriores, póngase en contacto con el soporte técnico.

Predeterminado

Existe una operación de vacuum full que mantiene un bloqueo de tabla durante mucho tiempo en el clúster.

Importante

En un periodo especificado, el módulo de alarma DMS detecta que VACUUM FULL ha estado funcionando durante mucho tiempo en el clúster y bloquea otras operaciones. Esta alarma se genera si hay otras sentencias SQL en el estado de espera de bloqueo y no se cumplen condiciones de supresión. Esta alarma se borrará si VACUUM FULL en el clúster no causó espera de bloqueo.

NOTA:

Si se genera esta alarma, póngase en contacto con los ingenieros de soporte técnico.

Personalizar

Nombre de la alarma de umbral definida por el usuario

Gravedad de la alarma definida por el usuario

Descripción de la alarma