Este conteúdo foi traduzido por máquina para sua conveniência e a Huawei Cloud não pode garantir que o conteúdo foi traduzido com precisão. Para exibir o conteúdo original, use o link no canto superior direito para mudar para a página em inglês.
Atualizado em 2023-05-04 GMT+08:00

Gerenciamento de alarmes

Visão geral

O gerenciamento de alarmes inclui a visualização e configuração de regras de alarme e a assinatura de informações de alarme. As regras de alarme exibem estatísticas de alarme e detalhes da semana passada para que os usuários visualizem alarmes de locatários. Além de fornecer um conjunto de regras de alarme padrão do GaussDB(DWS), esse recurso permite que você modifique os limites de alarme com base em seus próprios serviços. As notificações de alarme do GaussDB (DWS) são enviadas usando o serviço SMN.

Esse recurso suporta apenas o kernel do banco de dados 8.1.1.200 e posterior.

Visita da página de alarmes

  1. Faça login no console de gerenciamento do GaussDB(DWS).
  2. No painel de navegação à esquerda, clique em Alarms.
  3. Na página que é exibida:

    • Existing Alarm Statistics

      As estatísticas dos alarmes existentes nos últimos sete dias são exibidas pela severidade do alarme em um gráfico de barras. Desta forma, você pode ver claramente o número e a categoria dos alarmes gerados na semana passada.

    • Today's Alarms

      As estatísticas dos alarmes existentes no dia atual são exibidas pela severidade do alarme em uma lista. Desta forma, você pode ver claramente o número e a categoria dos alarmes não manipulados gerados no dia.

    • Detalhes de alarme

      Detalhes sobre todos os alarmes, manipulados e não manipulados, nos últimos sete dias são exibidos em uma tabela para que você localize rapidamente falhas, incluindo o nome do alarme, a severidade do alarme, o nome do cluster, o local, a descrição, a data de geração e o status.

    Os dados de alarme exibidos (no máximo 30 dias) são suportados pelo microsserviço do serviço de eventos.

Tipos de alarmes e alarmes

Tabela 1 Alarmes de limiar de fontes de alarme da DMS

Tipo

Nome

Severidade

Descrição

Padrão

Uso da CPU do nó excede o limite

Urgent

Esse alarme é gerado se o limite de uso da CPU (usuário do sistema) de qualquer nó no cluster for excedido dentro do período especificado e a restrição não for atendida. O alarme será apagado quando o uso da CPU (usuário do sistema) for menor que o limite e a restrição não for atendida.

Padrão

O uso da CPU do sistema de nó excede o limite

Urgent

Esse alarme é gerado se o limite de uso da CPU do sistema de qualquer nó no cluster for excedido dentro do período especificado e a restrição não for atendida. O alarme será apagado quando o uso da CPU do sistema for menor que o limite e a restrição não for atendida.

Padrão

O uso do disco do sistema de nó excede o limite

Urgente: > 85%; Importante: > 80%

Esse alarme é gerado se o limite de uso do disco do sistema (/) de qualquer nó no cluster for excedido dentro do período especificado e a restrição não for atendida. O alarme será apagado quando o uso do do disco do sistema /) for menor que o limite e a restrição não for atendida.

Padrão

Uso do disco de registro de nó excede o limite

Urgente: > 85%; Importante: > 80%

Esse alarme é gerado se o limite de uso do disco de log (/var/chroot/DWS/manager de qualquer nó no cluster for excedido dentro do período especificado e a restrição não for atendida. O alarme será apagado quando o uso do disco de log (/var/chroot/DWS/manager) for menor que o limite e a restrição não for atendida.

Padrão

Uso do disco de dados do nó excede o limite

Urgente: > 85%; Importante: > 80%

Este alarme é gerado se o limite do uso do disco de dados /var/chroot/DWS/data[n]) de qualquer nó no cluster for excedido dentro do período especificado e a restrição não for atendida. O alarme será apagado quando o uso do disco de dados (/var/chroot/DWS/data[n]) for menor que o limite e a restrição não for atendida.

Padrão

O uso de I/O de disco do sistema de nó excede o limite

Urgente

Esse alarme é gerado se o limite de uso (util de I/O do disco do sistema (/) de qualquer nó do cluster for excedido no período especificado e a restrição não for atendida. O alarme será apagado quando o uso (util) de I/O do disco do sistema (/ for menor que o limite e a restrição não for atendida.

Padrão

O uso de I/O do disco de log de nó excede o limite

Urgente

Esse alarme é gerado se o limite de uso (util) de I/O do disco de log (/var/chroot/DWS/manager) de qualquer nó no cluster for excedido dentro do período especificado e a restrição não for atendida. O alarme será apagado quando o uso (util) de I/O do disco de log (/var/chroot/DWS/manager) for menor que o limite e a restrição não for atendida.

Padrão

Uso de I/O do disco de dados do nó excede o limite

Urgente

Este alarme é gerado se o limite do uso (util) de I/O do disco de dados (/var/chroot/DWS/data[n] de qualquer nó no cluster for excedido dentro do período especificado e a restrição não for atendida. O alarme será apagado quando o uso (util) de I/O do disco de dados (/var/chroot/DWS/data[n]) for menor que o limite e a restrição não for atendida.

Padrão

Latência do disco do sistema de nó excede o limite

Importante

Este alarme é gerado se o limite de latência (await) de I/O do disco do sistema (/) de qualquer nó no cluster for excedido dentro do período especificado e a restrição não for atendida. O alarme será apagado quando a latência (await) de I/O do disco do sistema (/) for menor que o limite e a restrição não for atendida.

Padrão

A latência do disco do registro do nó excede o limite

Importante

Este alarme é gerado se o limite de latência (await) de I/O do disco de log (/var/chroot/DWS/manager) de qualquer nó no cluster for excedido dentro do período especificado e a restrição não for atendida. O alarme será apagado quando a latência (await) de I/O do disco de log (/var/chroot/DWS/manager) for menor que o limite e a restrição não for atendida.

Padrão

Latência do disco de dados do nó excede o limite

Importante

Este alarme é gerado se o limite de latência (await) de I/O do disco de dados (/var/chroot/DWS/data[n]) de qualquer nó no cluster for excedido dentro do período especificado e a restrição não for atendida. O alarme será apagado quando a latência (await) de I/O do disco de dados (/var/chroot/DWS/data[n]) for menor que o limite e a restrição não for atendida.

Padrão

O uso do Inode do disco do sistema do nó excede o limite

Urgente: > 95%; importante: > 90%

Esse alarme é gerado se o limite de uso do inode do de disco do sistema (/) de qualquer nó no cluster for excedido dentro do período especificado e a restrição não for atendida. O alarme será apagado quando o uso do inode do do disco do sistema (/) for menor que o limite e a restrição não for atendida.

Padrão

Uso do Inode do disco de log do nó excede o limie

Urgente: > 95%; importante: > 90%

Este alarme é gerado se o limite do uso do inode do disco de log (/var/chroot/DWS/manager) de qualquer nó no cluster for excedido dentro do período especificado e a restrição não for atendida. O alarme será apagado quando o uso do inode do disco de log (/var/chroot/DWS/manager) for menor que o limite e a restrição não for atendida.

Padrão

O uso do Inode do disco de dados do nó excede o limite

Urgente: > 95%; importante: > 90%

Este alarme é gerado se o limite do uso do inode do disco de dados (/var/chroot/DWS/data[n]) de qualquer nó no cluster for excedido dentro do período especificado e a restrição não for atendida. O alarme será apagado quando o uso do inode do disco de dados (/var/chroot/DWS/data[n]) for menor do que o limite e a restrição não for atendida.

Padrão

Dados descarregados em discos da instrução de consulta excedem o limite

Urgente

Esse alarme é gerado se o limite de dados descarregados em discos da instrução de SQL no cluster for excedido dentro do período especificado e a restrição não for atendida. O alarme só pode ser apagado depois de manipular a instrução de SQL.

Padrão

Número de instruções de consulta de enfileiramento excede o limite

Urgente

Este alarme é gerado se o limite do número de instruções de SQL em enfileiramento for excedido dentro do período especificado. O alarme será apagado quando o número de instruções de SQL em enfileiramento for menor que o limite.

Padrão

Congestão da fila no pool de recursos de cluster padrão

Urgente

Esse alarme é gerado se a fila no pool de recursos padrão de um cluster estiver congestionada e nenhuma condição de supressão de alarme for atendida. Este alarme será apagado se a fila não estiver congestionada.

Padrão

Uso da sonda de SQL de cluster excede o limite

Urgent

Esse alarme é gerado se o módulo de alarme da DMS detectar uma duração de execução da sonda de SQL em um servidor e nenhuma condição de supressão de alarme for atendida. Se nenhuma duração de execução exceder o limite, o alarme será apagado automaticamente.

NOTA:

O alarme é suportado apenas em 8.1.1.300 e versões posteriores. Para versões anteriores, entre em contato com o suporte técnico para atualizar o dms-agent para a versão 8.1.3.

Personalizado

Nome do alarme de limite definido pelo usuário

Severidade de alarme definida pelo usuário

Descrição do alarme