DWS_2000000020 SQL Probe of the Cluster Usage Exceeds the Threshold
Descrição do alarme
GaussDB(DWS) coleta o status de execução do teste SQL em cada nó no cluster a cada 30 segundos. Se a duração de execução de um teste SQL em um servidor em um cluster exceder duas vezes o limite (ou outro valor definido pelo usuário), um alarme crítico será gerado. Se a duração da execução de todos os testes SQL ficar abaixo do limite, o alarme crítico será apagado.
Se a duração do teste SQL permanecer maior que o limite de relatório de alarme, o alarme será gerado novamente em 24 horas (ou outro valor definido pelo usuário).
Atributos
ID do alarme |
Gravidade do alarme |
Apagar automaticamente |
---|---|---|
DWS_2000000020 |
Crítico |
Sim |
Parâmetros do alarme
Parâmetro |
Descrição |
---|---|
Alarm Source |
Nome do sistema para o qual o alarme é gerado, por exemplo, GaussDB(DWS). |
Cluster Name |
Cluster para o qual o alarme é gerado. |
Location Info |
ID e nome do cluster para o qual o alarme é gerado. Exemplo: cluster_id: xxxx-xxxx-xxxx-xxxx,cluster_name: test_dws |
Detail Information |
Informações detalhadas sobre o alarme, incluindo as informações de cluster e limite. Exemplo: CloudService=DWS, resourceId: xxxx-xxxx-xxxx-xxxx, resourceIdName: test_dws, first_alarm_time: 2022-11-26 11:14:58; The test_dws cluster exceeds twice the SQL probe threshold. The number of SQL probes in the cluster exceeds the threshold:'select xxx from xxxx'. |
Generated |
Hora em que um alarme é gerado. |
Status |
Status do alarme atual. |
Impacto no sistema
O desempenho do cluster se deteriora ou o cluster está com defeito.
Possíveis causas
A carga de serviço do cluster é alta ou o cluster está com defeito. Como resultado, a execução do teste SQL torna-se lenta.
Procedimento de manuseio
- No painel de navegação do painel de monitoramento, escolha Utilities > SQL Probes. Verifique a execução do teste SQL.
- No painel de navegação à esquerda, escolha Monitoring > Performance Monitoring. Verifique as métricas de monitoramento, como uso da CPU, uso do disco e uso da memória, para determinar se as cargas de trabalho são altas ou se alguma métrica é anormal.
- No painel de navegação, escolha Monitoring > Queries. Verifique se há consultas ou sessões que estão em execução há muito tempo e afetam a execução do cluster. Você pode encerrar sessões ou consultas anormais.
Liberação de alarme
Esse alarme é apagado automaticamente quando o tempo consumido por um teste SQL em todos os servidores em todos os clusters fica abaixo do limite.