Gestión de alarma
Descripción
La gestión de alarmas incluye la visualización y configuración de reglas de alarma y la suscripción a la información de alarma. Las reglas de alarma muestran estadísticas de alarmas y detalles de la semana pasada para que los usuarios vean las alarmas del tenant. Además de proporcionar un conjunto de reglas de alarma de GaussDB(DWS) predeterminadas, esta característica le permite modificar los umbrales de alarma basados en sus propios servicios. Las notificaciones de alarma de GaussDB(DWS) se envían utilizando el servicio SMN.
- Esta característica solo admite el núcleo de base de datos de 8.1.1.200 y posteriores.
- Actualmente, las alarmas no se pueden clasificar y gestionar por proyecto de empresa.
Visita la página de alarmas
- Inicie sesión en la consola de gestión de GaussDB(DWS).
- En el panel de navegación de la izquierda, haga clic en Alarms.
- Vaya a la página de alarma del almacén de datos. Esta página está dividida en tres áreas:
- Estadísticas de alarma existentes
Las estadísticas de las alarmas existentes en los últimos siete días se muestran por gravedad de alarma en un gráfico de barras. De esta manera, se puede ver claramente el número y la categoría de las alarmas generadas en la última semana.
- Alarmas de hoy
Las estadísticas de las alarmas existentes en el día actual se muestran por gravedad de alarma en una lista. De esta manera, se puede ver claramente el número y la categoría de las alarmas no manejadas generadas en el día.
- Detalles de la alarma
Los detalles sobre todas las alarmas, manejadas y no controladas, en los últimos siete días se muestran en una tabla para que pueda localizar rápidamente los errores, incluido el nombre de la alarma, la gravedad de la alarma, el nombre del clúster, la ubicación, la descripción, la fecha de generación y el estado.
Los datos de alarma mostrados (un máximo de 30 días) son compatibles con el Event Service microservice.
- Estadísticas de alarma existentes
Tipos de alarmas y alarmas
Tipo |
Nombre |
Severidad |
Descripción |
---|---|---|---|
Predeterminado |
El uso de la CPU del nodo supera el umbral |
Urgente |
Esta alarma se genera si el umbral de uso de CPU (sistema + usuario) de cualquier nodo en el clúster se excede dentro del período especificado y no se cumple la restricción. La alarma se borrará cuando el uso de CPU (sistema + usuario) sea inferior al umbral y no se cumpla la restricción. |
Predeterminado |
El uso del disco de datos del nodo supera el umbral |
Urgente: > 85%; Importante: > 80% |
Esta alarma se genera si el umbral de uso del disco de datos (/var/chroot/DWS/data[n]) de cualquier nodo en el clúster se excede dentro del período especificado y no se cumple la restricción. La alarma se borrará cuando el uso del disco de datos (/var/chroot/DWS/data[n]) sea menor que el umbral y no se cumpla la restricción. |
Predeterminado |
El uso de E/S del disco de datos del nodo supera el umbral |
Urgente |
Esta alarma se genera si el umbral de uso de E/S (util) de disco de datos (/var/chroot/DWS/data[n]) de cualquier nodo en el clúster se excede dentro del período especificado y no se cumple la restricción. La alarma se borrará cuando el uso de E/S (util) del disco de datos (/var/chroot/DWS/data[n]) sea inferior al umbral y no se cumpla la restricción. |
Predeterminado |
La latencia del disco de datos de nodo supera el umbral |
Importante |
Esta alarma se genera si el umbral de latencia de E/S (await) del disco de datos (/var/chroot/DWS/data[n]) de cualquier nodo del clúster se excede dentro del período especificado y no se cumple la restricción. La alarma se borrará cuando la latencia de E/S (await) del disco de datos (/var/chroot/DWS/data[n]) sea menor que el umbral y no se cumpla la restricción. |
Predeterminado |
El uso del Inode del disco de datos del nodo supera el umbral |
Urgente: > 95%; importante: > 90% |
Esta alarma se genera si el umbral del uso del inode del disco de datos (/var/chroot/DWS/data[n]) de cualquier nodo del clúster se excede dentro del período especificado y no se cumple la restricción. La alarma se borrará cuando el uso del inode del disco de datos (/var/chroot/DWS/data[n]) sea inferior al umbral y no se cumpla la restricción. |
Predeterminado |
Los datos vaciados en discos de la sentencia de consulta superan el umbral |
Urgente |
Esta alarma se genera si el umbral de datos vaciados en discos de la sentencia SQL en el clúster se supera dentro del período especificado y no se cumple la restricción. La alarma solo se puede borrar después de que usted maneje la sentencia SQL. |
Predeterminado |
El número de sentencias de consulta de cola supera el umbral |
Urgente |
Esta alarma se genera si se excede el umbral del número de sentencias SQL en cola dentro del período especificado. La alarma se borrará cuando el número de sentencias SQL en cola sea menor que el umbral. |
Predeterminado |
Congestión de colas en el grupo de recursos predeterminado del clúster |
Urgente |
Esta alarma se genera si la cola en el grupo de recursos predeterminado de un clúster está congestionada y no se cumplen las condiciones de supresión de alarma. Esta alarma se borrará si la cola no está congestionada. |
Predeterminado |
La tasa de retransmisión de pérdida de paquetes en la red del clúster supera el umbral. |
Urgente |
Esta alarma se genera si el módulo de alarma DMS detecta una alta tasa de retransmisión en un servidor y no se cumplen condiciones de supresión de alarma. Si la velocidad de retransmisión disminuye, la alarma se borrará automáticamente. |
Predeterminado |
Duración larga de la ejecución de la sonda SQL en un clúster |
Urgente |
Esta alarma se genera si el módulo de alarma DMS detecta una duración de ejecución de sonda SQL en un servidor y no se cumplen condiciones de supresión de alarma. Si ninguna duración de ejecución supera el umbral, la alarma se borrará automáticamente.
NOTA:
La alarma solo se admite en 8.1.1.300 y versiones de clúster posteriores. Para versiones anteriores, póngase en contacto con el soporte técnico. |
Predeterminado |
Existe una operación de vacuum full que mantiene un bloqueo de tabla durante mucho tiempo en el clúster. |
Importante |
En un periodo especificado, el módulo de alarma DMS detecta que VACUUM FULL ha estado funcionando durante mucho tiempo en el clúster y bloquea otras operaciones. Esta alarma se genera si hay otras sentencias SQL en el estado de espera de bloqueo y no se cumplen condiciones de supresión. Esta alarma se borrará si VACUUM FULL en el clúster no causó espera de bloqueo.
NOTA:
Si se genera esta alarma, póngase en contacto con los ingenieros de soporte técnico. |
Personalizar |
Nombre de la alarma de umbral definida por el usuario |
Gravedad de la alarma definida por el usuario |
Descripción de la alarma |