Gerenciamento de alarmes
Visão geral
O gerenciamento de alarmes inclui a visualização e configuração de regras de alarme e a assinatura de informações de alarme. As regras de alarme exibem estatísticas de alarme e detalhes da semana passada para que os usuários visualizem alarmes de locatários. Além de fornecer um conjunto de regras de alarme padrão do GaussDB(DWS), esse recurso permite que você modifique os limites de alarme com base em seus próprios serviços. As notificações de alarme do GaussDB (DWS) são enviadas usando o serviço SMN.
![](https://support.huaweicloud.com/intl/pt-br/mgtg-dws/public_sys-resources/note_3.0-pt-br.png)
Esse recurso suporta apenas o kernel do banco de dados 8.1.1.200 e posterior.
Visita da página de alarmes
- Faça login no console de gerenciamento do GaussDB(DWS).
- No painel de navegação à esquerda, clique em Alarms.
- Na página que é exibida:
- Existing Alarm Statistics
As estatísticas dos alarmes existentes nos últimos sete dias são exibidas pela severidade do alarme em um gráfico de barras. Desta forma, você pode ver claramente o número e a categoria dos alarmes gerados na semana passada.
- Today's Alarms
As estatísticas dos alarmes existentes no dia atual são exibidas pela severidade do alarme em uma lista. Desta forma, você pode ver claramente o número e a categoria dos alarmes não manipulados gerados no dia.
- Detalhes de alarme
Detalhes sobre todos os alarmes, manipulados e não manipulados, nos últimos sete dias são exibidos em uma tabela para que você localize rapidamente falhas, incluindo o nome do alarme, a severidade do alarme, o nome do cluster, o local, a descrição, a data de geração e o status.
Os dados de alarme exibidos (no máximo 30 dias) são suportados pelo microsserviço do serviço de eventos.
- Existing Alarm Statistics
Tipos de alarmes e alarmes
Tipo |
Nome |
Severidade |
Descrição |
---|---|---|---|
Padrão |
Uso da CPU do nó excede o limite |
Urgent |
Esse alarme é gerado se o limite de uso da CPU (usuário do sistema) de qualquer nó no cluster for excedido dentro do período especificado e a restrição não for atendida. O alarme será apagado quando o uso da CPU (usuário do sistema) for menor que o limite e a restrição não for atendida. |
Padrão |
O uso da CPU do sistema de nó excede o limite |
Urgent |
Esse alarme é gerado se o limite de uso da CPU do sistema de qualquer nó no cluster for excedido dentro do período especificado e a restrição não for atendida. O alarme será apagado quando o uso da CPU do sistema for menor que o limite e a restrição não for atendida. |
Padrão |
O uso do disco do sistema de nó excede o limite |
Urgente: > 85%; Importante: > 80% |
Esse alarme é gerado se o limite de uso do disco do sistema (/) de qualquer nó no cluster for excedido dentro do período especificado e a restrição não for atendida. O alarme será apagado quando o uso do do disco do sistema /) for menor que o limite e a restrição não for atendida. |
Padrão |
Uso do disco de registro de nó excede o limite |
Urgente: > 85%; Importante: > 80% |
Esse alarme é gerado se o limite de uso do disco de log (/var/chroot/DWS/manager de qualquer nó no cluster for excedido dentro do período especificado e a restrição não for atendida. O alarme será apagado quando o uso do disco de log (/var/chroot/DWS/manager) for menor que o limite e a restrição não for atendida. |
Padrão |
Uso do disco de dados do nó excede o limite |
Urgente: > 85%; Importante: > 80% |
Este alarme é gerado se o limite do uso do disco de dados /var/chroot/DWS/data[n]) de qualquer nó no cluster for excedido dentro do período especificado e a restrição não for atendida. O alarme será apagado quando o uso do disco de dados (/var/chroot/DWS/data[n]) for menor que o limite e a restrição não for atendida. |
Padrão |
O uso de I/O de disco do sistema de nó excede o limite |
Urgente |
Esse alarme é gerado se o limite de uso (util de I/O do disco do sistema (/) de qualquer nó do cluster for excedido no período especificado e a restrição não for atendida. O alarme será apagado quando o uso (util) de I/O do disco do sistema (/ for menor que o limite e a restrição não for atendida. |
Padrão |
O uso de I/O do disco de log de nó excede o limite |
Urgente |
Esse alarme é gerado se o limite de uso (util) de I/O do disco de log (/var/chroot/DWS/manager) de qualquer nó no cluster for excedido dentro do período especificado e a restrição não for atendida. O alarme será apagado quando o uso (util) de I/O do disco de log (/var/chroot/DWS/manager) for menor que o limite e a restrição não for atendida. |
Padrão |
Uso de I/O do disco de dados do nó excede o limite |
Urgente |
Este alarme é gerado se o limite do uso (util) de I/O do disco de dados (/var/chroot/DWS/data[n] de qualquer nó no cluster for excedido dentro do período especificado e a restrição não for atendida. O alarme será apagado quando o uso (util) de I/O do disco de dados (/var/chroot/DWS/data[n]) for menor que o limite e a restrição não for atendida. |
Padrão |
Latência do disco do sistema de nó excede o limite |
Importante |
Este alarme é gerado se o limite de latência (await) de I/O do disco do sistema (/) de qualquer nó no cluster for excedido dentro do período especificado e a restrição não for atendida. O alarme será apagado quando a latência (await) de I/O do disco do sistema (/) for menor que o limite e a restrição não for atendida. |
Padrão |
A latência do disco do registro do nó excede o limite |
Importante |
Este alarme é gerado se o limite de latência (await) de I/O do disco de log (/var/chroot/DWS/manager) de qualquer nó no cluster for excedido dentro do período especificado e a restrição não for atendida. O alarme será apagado quando a latência (await) de I/O do disco de log (/var/chroot/DWS/manager) for menor que o limite e a restrição não for atendida. |
Padrão |
Latência do disco de dados do nó excede o limite |
Importante |
Este alarme é gerado se o limite de latência (await) de I/O do disco de dados (/var/chroot/DWS/data[n]) de qualquer nó no cluster for excedido dentro do período especificado e a restrição não for atendida. O alarme será apagado quando a latência (await) de I/O do disco de dados (/var/chroot/DWS/data[n]) for menor que o limite e a restrição não for atendida. |
Padrão |
O uso do Inode do disco do sistema do nó excede o limite |
Urgente: > 95%; importante: > 90% |
Esse alarme é gerado se o limite de uso do inode do de disco do sistema (/) de qualquer nó no cluster for excedido dentro do período especificado e a restrição não for atendida. O alarme será apagado quando o uso do inode do do disco do sistema (/) for menor que o limite e a restrição não for atendida. |
Padrão |
Uso do Inode do disco de log do nó excede o limie |
Urgente: > 95%; importante: > 90% |
Este alarme é gerado se o limite do uso do inode do disco de log (/var/chroot/DWS/manager) de qualquer nó no cluster for excedido dentro do período especificado e a restrição não for atendida. O alarme será apagado quando o uso do inode do disco de log (/var/chroot/DWS/manager) for menor que o limite e a restrição não for atendida. |
Padrão |
O uso do Inode do disco de dados do nó excede o limite |
Urgente: > 95%; importante: > 90% |
Este alarme é gerado se o limite do uso do inode do disco de dados (/var/chroot/DWS/data[n]) de qualquer nó no cluster for excedido dentro do período especificado e a restrição não for atendida. O alarme será apagado quando o uso do inode do disco de dados (/var/chroot/DWS/data[n]) for menor do que o limite e a restrição não for atendida. |
Padrão |
Dados descarregados em discos da instrução de consulta excedem o limite |
Urgente |
Esse alarme é gerado se o limite de dados descarregados em discos da instrução de SQL no cluster for excedido dentro do período especificado e a restrição não for atendida. O alarme só pode ser apagado depois de manipular a instrução de SQL. |
Padrão |
Número de instruções de consulta de enfileiramento excede o limite |
Urgente |
Este alarme é gerado se o limite do número de instruções de SQL em enfileiramento for excedido dentro do período especificado. O alarme será apagado quando o número de instruções de SQL em enfileiramento for menor que o limite. |
Padrão |
Congestão da fila no pool de recursos de cluster padrão |
Urgente |
Esse alarme é gerado se a fila no pool de recursos padrão de um cluster estiver congestionada e nenhuma condição de supressão de alarme for atendida. Este alarme será apagado se a fila não estiver congestionada. |
Padrão |
Uso da sonda de SQL de cluster excede o limite |
Urgent |
Esse alarme é gerado se o módulo de alarme da DMS detectar uma duração de execução da sonda de SQL em um servidor e nenhuma condição de supressão de alarme for atendida. Se nenhuma duração de execução exceder o limite, o alarme será apagado automaticamente.
NOTA:
O alarme é suportado apenas em 8.1.1.300 e versões posteriores. Para versões anteriores, entre em contato com o suporte técnico para atualizar o dms-agent para a versão 8.1.3. |
Personalizado |
Nome do alarme de limite definido pelo usuário |
Severidade de alarme definida pelo usuário |
Descrição do alarme |