DWS_2000000009 Node Data Disk I/O Usage Exceeds the Threshold
Descrição
O GaussDB(DWS) coleta o uso de I/O do disco de dados de cada nó do cluster a cada 30 segundos. Este alarme é gerado quando o uso médio de um disco de dados em um nó excede 90% (configurável) nos últimos 10 minutos (configurável) e é automaticamente apagado quando o uso médio cai abaixo de 85% (limite de alarme menos 5%).
Se o uso de I/O do disco de dados de um nó for sempre maior que o limite de alarme, o alarme é gerado novamente 24 horas depois (configurável).
Atributos do alarme
ID do alarme |
Gravidade do alarme |
Limpar automaticamente |
---|---|---|
DWS_2000000009 |
Crítico |
Sim |
Parâmetros do alarme
Parâmetro |
Descrição |
---|---|
Alarm Source |
Indica o nome do sistema para o qual o alarme é gerado, por exemplo, GaussDB(DWS). |
Cluster Name |
Indica o cluster para o qual o alarme é gerado. |
Location Information |
Inclui ID e nome do cluster para o qual o alarme é gerado, e ID e nome da instância para a qual o alarme é gerado, por exemplo, cluster_id: xxxx-xxxx-xxxx-xxxx, cluster_name: test_dws, instance_id: xxxx-xxxx-xxxx-xxxx, instance_name: test_dws-dws-cn-cn-1-1. |
Detail Information |
Informações detalhadas sobre o alarme, incluindo informações de cluster, instância, disco e limite. Exemplo: CloudService=DWS, resourceId= xxxx-xxxx-xxxx-xxxx, resourceIdName=test_dws, instance_id: xxxx-xxxx-xxxx-xxxx, instance_name: test_dws-dws-cn-cn-1-1, host_name: host-192-168-1-122, disk_name: /dev/vdb, first_alarm_time: 2022-01-30 10:30:00; o uso de I/O do disco de registro do nó em 10 minutos é de 90,54%, excedendo o limite de 90%. |
Generated |
Hora em que um alarme é gerado. |
Status |
Indica o status do alarme atual. |
Impacto no sistema
- O alto uso de I/O do disco afeta o desempenho de leitura e gravação de dados, afetando o desempenho do cluster.
- Um grande número de gravações em disco ocupa a capacidade do disco. Se a capacidade do disco exceder 90%, o cluster se tornará somente leitura.
Possíveis causas
- Um grande número de operações de leitura ou gravação são realizadas durante as horas de pico.
- Uma grande quantidade de dados é transferida para os discos devido à execução de instruções complexas.
- Os dados são verificados pelo operador Scan.
Procedimento de manuseio
- Na página Clusters, localize a linha que contém o cluster de destino e clique em Monitoring na coluna Operation.
- No painel de navegação à esquerda, escolha Monitoring > Node Monitoring. Na página Node Monitoring, exiba o uso de I/O do disco de dados e a taxa de I/O do disco.
Se a taxa de I/O do disco for alta e o uso do disco de dados continuar aumentando, isso indica que os serviços estão gravando dados em discos. Isso pode ser causado por consultas complexas.
- Clique em Queries na árvore de navegação à esquerda para exibir as consultas em tempo real.
Se o tempo de execução de uma instrução exceder o tempo esperado, pare a consulta e verifique o uso de I/O do disco novamente. Para mais detalhes, consulte 2.
Liberação de alarme
Este alarme é apagado automaticamente quando o uso de I/O do disco de dados cai para um determinado valor.