Métricas de monitoramento
Você pode verificar o status e os recursos disponíveis de um cluster e aprender sobre seu consumo de recursos em tempo real por meio dos itens de monitoramento do GaussDB(DWS).
Tabela 1 descreve as métricas de monitoramento do GaussDB(DWS).
Objeto monitorado |
Métrica |
Descrição |
Intervalo de valores |
Período de monitoramento (dados brutos) |
---|---|---|---|---|
Visão geral de cluster |
Cluster Status |
Status de um cluster. |
Normal/Abnormal/Degraded |
30s |
Nodes |
Número de nós disponíveis e número total de nós (Available/Total) em um cluster. |
≥ 0 |
60s |
|
CNs |
Número de CNs em um cluster. |
≥ 0 |
60s |
|
Databases |
Número de bancos de dados criados em um cluster. |
≥ 0 |
90s |
|
Consumo de recursos |
CPU Usage |
Uso médio da CPU em tempo real de todos os nós em um cluster. |
0% a 100% |
30s |
Memory Usage |
Uso médio de memória em tempo real de todos os nós em um cluster. |
0% a 100% |
30s |
|
Disk Usage |
Uso médio do disco em tempo real de todos os nós em um cluster. |
0% a 100% |
30s |
|
Disk I/O |
Média de I/O de disco em tempo real de todos os nós em um cluster. |
≥ 0 KB/s |
30s |
|
Network I/O |
Média de I/O de rede em tempo real de todas as NICs em um cluster. |
≥ 0 KB/s |
30s |
|
As 5 consultas mais demoradas |
Query ID |
ID de uma consulta, que é gerada automaticamente pelo banco de dados. |
≥ 0 |
180s |
SQL Statement |
Instrução de consulta executada por um usuário. |
String |
180s |
|
Execution Time |
Tempo de execução de uma instrução de consulta (unidade: ms). |
≥ 0 ms |
180s |
|
Top 5 consultas com mais dados gravados em disco |
Query ID |
ID de uma consulta, que é gerada automaticamente pelo banco de dados. |
≥ 0 |
180s |
SQL Statement |
Instrução de consulta executada por um usuário. |
String |
180s |
|
Data Written to Disk |
Dados a serem gravados em discos depois que um usuário executa uma instrução (unidade: MB). |
≥ 0 MB |
180s |
|
Métricas de recursos do cluster |
CPU Usage |
Uso médio da CPU de todos os nós em um cluster. |
0% a 100% |
30s |
Memory Usage |
Uso médio de memória de todos os nós em um cluster. |
0% a 100% |
30s |
|
Disk Usage |
Uso médio de todos os discos em um cluster. |
0% a 100% |
30s |
|
Disk I/O Usage |
Uso médio de I/O de todos os discos em um cluster. |
0% a 100% |
30s |
|
Network I/O Usage |
Uso médio de I/O de todas as NICs em um cluster. |
0% a 100% |
30s |
|
Principais métricas do banco de dados |
Cluster Status |
Status de execução do cluster. |
Normal/Degraded/Abnormal |
30s |
Cluster Abnormal CNs |
Número de CNs anormais no cluster |
≥ 0 |
60s |
|
Cluster Read-only |
Se o cluster está no estado somente leitura |
Yes/No |
30s |
|
Concurrent Sessions |
Número de sessões simultâneas em um cluster dentro de um período especificado. |
≥ 0 |
30s |
|
Concurrent Queries |
Número de consultas simultâneas em um cluster dentro de um período especificado. |
≥ 0 |
30s |
|
Visão geral de monitoramento de nó |
Node Name |
Nome de um nó em um cluster. |
String |
30s |
CPU Usage |
Uso da CPU de um host. |
0% a 100% |
30s |
|
Memory Usage |
Uso de memória de um host. |
0% a 100% |
30s |
|
Average Disk Usage (%) |
Uso do disco de um host. |
0% a 100% |
30s |
|
IP Address |
Endereço IP de serviço de um host. |
String |
30s |
|
Disk I/O |
I/O de disco de um host (unidade: KB/s) |
≥ 0 KB/s |
30s |
|
TCP Protocol Stack Retransmission Rate |
Taxa de retransmissão de pacotes TCP por unidade de tempo. |
0% a 100% |
30s |
|
Status |
Status de funcionamento de uma porta. |
Online/Offline |
30s |
|
Discos de monitoramento de nó |
Node Name |
Nome de um nó em um cluster. |
String |
30s |
Disk Name |
Nome de um disco em um host. |
String |
30s |
|
Disk Capacity |
Capacidade do disco do host (unidade: GB) |
≥ 0 GB |
30s |
|
Disk Usage |
Uso do disco de um host. |
0% a 100% |
30s |
|
Disk Read Rate |
Taxa de leitura do disco do host (unidade: KB/s) |
≥ 0 KB/s |
30s |
|
Disk Write Rate |
Taxa de gravação em disco do host (unidade: KB/s) |
≥ 0 KB/s |
30s |
|
I/O Wait Time (await, ms) |
Tempo médio de espera para cada solicitação de I/O (unidade: ms) |
≥ 0 ms |
30s |
|
I/O Service Time (svctm, ms) |
Tempo médio de processamento para cada solicitação de I/O (unidade: ms) |
≥ 0 ms |
30s |
|
I/O Utility (util, %) |
Uso de I/O de disco de um host. |
0% a 100% |
30s |
|
Rede de monitoramento de nó |
Node Name |
Nome de um nó em um cluster. |
String |
30s |
NIC Name |
Nome da NIC em um host. |
String |
30s |
|
NIC Status |
Status da NIC. |
up/down |
30s |
|
NIC Speed |
Taxa de trabalho de uma NIC, em Mbit/s. |
≥ 0 |
30s |
|
Received Packets |
Número de pacotes recebidos de uma NIC. |
≥ 0 |
30s |
|
Sent Packets |
Número de pacotes enviados de uma NIC. |
≥ 0 |
30s |
|
Lost Packets Received |
Número de pacotes perdidos recebidos de uma NIC. |
≥ 0 |
30s |
|
Receive Rate |
Número de bytes recebidos por uma NIC por unidade de tempo (KB/s). |
≥ 0 KB/s |
30s |
|
Transmit Rate |
Número de bytes enviados por uma NIC por unidade de tempo (unidade: KB/s) |
≥ 0 KB/s |
30s |
|
Monitoramento de banco de dados |
Database Name |
Nome do banco de dados criado por um usuário em um cluster. |
String |
60s |
Usage |
Capacidade utilizada da base de dados atual (unidade: GB). |
≥ 0 GB |
86400s |
|
Users |
Número de usuários no banco de dados atual. |
≥ 0 |
30s |
|
Sessions |
Número de sessões no banco de dados atual. |
≥ 0 |
30s |
|
Applications |
Número de aplicações no banco de dados atual. |
≥ 0 |
30s |
|
Queries |
Número de consultas ativas no banco de dados atual. |
≥ 0 |
30s |
|
Scanning Rows |
Número de linhas retornadas pela consulta de verificação de tabela completa no banco de dados atual. |
≥ 0 |
60s |
|
Index Query Rows |
Número de linhas retornadas pela consulta de índice no banco de dados atual. |
≥ 0 |
60s |
|
Inserted Rows |
Número de linhas inseridas no banco de dados atual. |
≥ 0 |
60s |
|
Updated Rows |
Número de linhas atualizadas no banco de dados atual. |
≥ 0 |
60s |
|
Deleted Rows |
Número de linhas excluídas do banco de dados atual. |
≥ 0 |
60s |
|
Executed Transactions |
Número de execuções de transação no banco de dados atual. |
≥ 0 |
60s |
|
Transaction Rollbacks |
Número de transações no banco de dados atual que foram revertidas. |
≥ 0 |
60s |
|
Deadlocks |
Número de deadlocks detectados no banco de dados atual. |
≥ 0 |
60s |
|
Temporary Files |
Número de arquivos temporários criados no banco de dados atual. |
≥ 0 |
60s |
|
Temporary File Capacity |
Tamanho dos arquivos temporários gravados pelo banco de dados atual, em GB. |
≥ 0 |
60s |
|
Monitoramento de desempenho |
Cluster CPU Usage |
Uso médio da CPU de todos os nós em um cluster. |
0% a 100% |
30s |
Cluster Memory Usage |
Uso médio de memória de todos os nós em um cluster. |
0% a 100% |
30s |
|
Cluster Disk Usage |
Uso médio do disco de todos os nós em um cluster. |
0% a 100% |
30s |
|
Cluster Disk I/O |
I/O média de todos os discos em um cluster. |
0% a 100% |
30s |
|
Cluster Network I/O |
I/O média de todas as NICs em um cluster. |
0% a 100% |
30s |
|
Cluster Status |
Tendência histórica do status do cluster. |
Normal/Abnormal/Degraded |
30s |
|
Cluster Read-only |
Tendência histórica da tendência de mudança de status somente leitura do cluster. |
Yes/No |
30s |
|
Cluster Abnormal CNs |
Tendência histórica do número de CNs anormais no cluster. |
≥ 0 |
60s |
|
Cluster Abnormal DNs |
Tendência histórica do número de DNs anormais no cluster. |
≥ 0 |
60s |
|
Cluster CPU Usage of DNs |
Uso médio da CPU de todos os DNs em um cluster. |
0% a 100% |
60s |
|
Cluster Sessions |
Tendência histórica do número de sessões em um cluster. |
≥ 0 |
30s |
|
Cluster Queries |
Tendência de mudança histórica do número de consultas no cluster. |
≥ 0 |
30s |
|
Cluster Deadlocks |
Tendência histórica do número de deadlocks em um cluster. |
≥ 0 |
60s |
|
Cluster TPS |
Número médio de transações por segundo de todos os bancos de dados em um cluster. Fórmula: (delta_xact_commit + delta_xact_rollback)/current_collect_rate |
≥ 0 |
60s |
|
Cluster QPS |
Número médio de solicitações simultâneas por segundo de todos os bancos de dados em um cluster. Fórmula: delta_query_count/current_collect_rate |
≥ 0 |
60s |
|
Database Sessions |
Tendência histórica do número de sessões em um único banco de dados em um cluster. |
≥ 0 |
30s |
|
Database Queries |
Tendência histórica do número de consultas em um único banco de dados em um cluster. |
≥ 0 |
30s |
|
Database Inserted Rows |
Tendência histórica do número de linhas inseridas em um único banco de dados em um cluster. |
≥ 0 |
60s |
|
Database Updated Rows |
Tendência histórica do número de linhas atualizadas em um único banco de dados em um cluster. |
≥ 0 |
60s |
|
Database Deleted Rows |
Tendência histórica do número de linhas excluídas em um único banco de dados em um cluster. |
≥ 0 |
60s |
|
Database Capacity |
Tendência histórica da capacidade em um único banco de dados em um cluster. |
≥ 0 |
86400s |
|
Sessão ao vivo |
Session ID |
ID da sessão atual (ID do thread de consulta). |
String |
30s |
User Name |
Nome do usuário que executa a sessão atual. |
String |
30s |
|
Database Name |
Nome do banco de dados conectado à sessão atual. |
String |
30s |
|
Session Duration |
Duração da sessão atual (unidade: ms). |
≥ 0 ms |
30s |
|
Application Name |
Nome da aplicação que cria a sessão atual. |
String |
30s |
|
Queries |
Número de instruções SQL executadas na sessão atual. |
≥ 0 |
30s |
|
Latest Query Duration |
Duração da execução da instrução SQL anterior na sessão atual. |
≥ 0 ms |
30s |
|
Client IP Address |
Endereço IP do cliente que inicia a sessão atual. |
String |
30s |
|
Connected CN |
CN conectado da sessão atual. |
String |
30s |
|
Session Status |
Status de execução da sessão atual. |
Running/Idle/Retry |
30s |
|
Consulta em tempo real |
Query ID |
ID de consulta de uma instrução de consulta atual, que é um identificador exclusivo alocado pelo kernel para cada instrução de consulta. |
String |
30s |
User Name |
Nome do usuário que submete a instrução de consulta atual. |
String |
30s |
|
Database Name |
Nome do banco de dados correspondente à instrução de consulta atual. |
String |
30s |
|
Application Name |
Nome da aplicação correspondente à instrução de consulta atual. |
String |
30s |
|
Resource Pool |
Nome do pool de recursos da instrução de consulta atual. |
String |
30s |
|
Submitted |
Carimbo de data/hora quando a instrução de consulta atual é enviada. |
String |
30s |
|
Blocking Time |
Tempo de espera antes da instrução de consulta atual ser executada, em ms. |
≥ 0 |
30s |
|
Execution Time |
Tempo de execução da instrução de consulta atual, em ms. |
≥ 0 |
30s |
|
CPU Time |
Tempo total de CPU gasto pela instrução de consulta atual em todos os DNs, em ms. |
≥ 0 |
30s |
|
CPU Time Skew |
Distorção de tempo de CPU da instrução de consulta atual entre todos os DNs. |
0% a 100% |
30s |
|
Statement |
Instrução SQL que está sendo executada. |
String |
30s |
|
Connected CN |
Nome do CN que submete a instrução de consulta atual. |
String |
30s |
|
Client IP Address |
Endereço IP do cliente que envia a instrução de consulta atual. |
String |
30s |
|
Lane |
Pista onde a instrução de consulta atual está localizada. |
Fast Lane/Slow Lane |
30s |
|
Query Status |
Status da consulta da instrução que está sendo executada. |
String |
30s |
|
Session ID |
ID da sessão da instrução de consulta atual, que é um identificador exclusivo alocado pelo kernel para cada conexão do cliente. |
String |
30s |
|
Queuing Status |
Status da execução da consulta atual no banco de dados, indicando se a consulta está enfileirada no pool de recursos. |
Yes/No |
30s |
|
Consulta histórica |
Query ID |
ID de consulta de uma instrução de consulta, que é um identificador exclusivo alocado pelo kernel para cada instrução de consulta. |
String |
180s |
User Name |
Nome do usuário que envia uma instrução de consulta. |
String |
180s |
|
Application Name |
Nome da aplicação correspondente a uma instrução de consulta. |
String |
180s |
|
Database Name |
Nome do banco de dados correspondente a uma instrução de consulta. |
String |
180s |
|
Resource Pool |
Nome do pool de recursos da instrução de consulta atual. |
String |
180s |
|
Submitted |
Carimbo de data/hora quando uma instrução de consulta é enviada. |
String |
180s |
|
Blocking Time |
Tempo de espera antes da instrução de consulta ser executada, em ms. |
≥ 0 |
180s |
|
Execution Time |
Tempo de execução da instrução de consulta, em ms. |
≥ 0 |
180s |
|
CPU Time |
Tempo total de CPU gasto pela instrução de consulta em todos os DNs, em ms. |
≥ 0 |
180s |
|
CPU Time Skew |
Distorção de tempo de CPU de uma instrução de consulta executada em todos os DNs. |
0% a 100% |
180s |
|
Statement |
Instruções de consulta a serem analisadas |
String |
180s |
|
Monitoramento de instância lenta |
Slow Instance |
Número de instâncias lentas detectadas no ponto de tempo atual. |
≥ 0 |
240s |
Detected |
Hora em que uma instância lenta é detectada pela primeira vez. |
String |
240s |
|
Node Name |
Nome do nó onde a instância lenta é implementada. |
String |
240s |
|
Instance |
Nome de uma instância. |
String |
240s |
|
Slow Node Detections (within 24 hours) |
Número de vezes que uma instância lenta é detectada dentro de 24 horas. |
≥ 0 |
240s |
|
Monitoramento do pool de recursos |
Resource Pool |
Nome de um pool de recursos em um cluster. |
String |
120s |
CPU Usage |
Uso da CPU em tempo real de um pool de recursos. |
0% a 100% |
120s |
|
CPU Resource |
Cota de uso de CPU de um pool de recursos. |
0% a 100% |
120s |
|
Real-Time Concurrent Short Queries |
Simultaneidade simples em um pool de recursos. |
≥ 0 |
120s |
|
Concurrent Short Queries |
Cota para simultaneidade simples em um pool de recursos. |
≥ 0 |
120s |
|
Real-Time Concurrent Queries |
Simultaneidade complexa em tempo real em um pool de recursos. |
≥ 0 |
120s |
|
Query Concurrency |
Cota para simultaneidade complexa em um pool de recursos. |
≥ 0 |
120s |
|
Storage |
Cota de recursos de armazenamento de um pool de recursos. |
≥ 0 |
120s |
|
Disk Usage |
Uso de disco de um pool de recursos. |
0% a 100% |
120s |
|
Memory |
Cota de memória de um pool de recursos. |
≥ 0 |
120s |
|
Memory Usage |
Uso de memória de um pool de recursos. |
0% a 100% |
120s |
|
Consultas em espera em um pool de recursos |
User |
Nome do usuário das consultas em espera |
String |
120s |
Application |
Nome da aplicação a ser consultada. |
String |
120s |
|
Database |
Nome do banco de dados a ser consultado. |
String |
120s |
|
Queuing Status |
Status de execução de uma consulta no banco de dados (CCN/CN/DN). |
String |
120s |
|
Wait Time |
Tempo de espera por uma consulta em espera (unidade: ms). |
≥ 0 ms |
120s |
|
Resource Pool |
Pool de recursos da consulta em espera. |
String |
120s |
|
Statement |
Instrução de consulta para o status de espera. |
String |
120s |
|
Consultas de fusíveis |
Query ID |
ID de consulta da instrução de consulta de fusíveis. |
String |
120s |
Query Statement |
Instrução de consulta para o status de fusível. |
String |
120s |
|
Blocking Time |
O tempo de bloqueio antes da instrução de consulta disparar o fusível, em ms. |
≥ 0 |
120s |
|
Execution Time |
Tempo de execução antes da instrução de consulta disparar o fusível, em ms. |
≥ 0 |
120s |
|
CPU Time |
Tempo médio de CPU consumido por cada DN antes que a instrução de consulta acione o fusível, em ms. |
≥ 0 |
120s |
|
CPU Skew |
Taxa de distorção do tempo de CPU consumido por cada DN antes da instrução de consulta disparar o fusível. |
0% a 100% |
120s |
|
Exception Handling |
Método de manipulação após a instrução de consulta dispara o fusível. |
Abort/Degrade |
120s |
|
Status |
Status de tratamento do fusível de uma instrução de consulta. |
Executing/Completed |
120s |
|
Ajuste de SQL |
Query ID |
Endereço IP da consulta atual (ID da lógica da consulta). |
String |
180s |
Database |
Nome do banco de dados onde a consulta atual é executada. |
String |
180s |
|
Schema Name |
Nome do esquema de consulta atual. |
String |
180s |
|
User Name |
Nome do usuário que executa a consulta. |
String |
180s |
|
Client |
Nome do cliente que inicia a consulta atual. |
String |
180s |
|
Client IP Address |
Endereço IP do cliente que inicia a consulta atual. |
String |
180s |
|
Running Time |
Tempo de execução da consulta atual, em ms. |
≥ 0 |
180s |
|
CPU Time |
Tempo de CPU da consulta atual, em ms. |
≥ 0 |
180s |
|
Scale-Out Started |
Hora de início da consulta atual. |
Timestamp |
180s |
|
Completed |
Hora de término da consulta atual. |
Timestamp |
180s |
|
Details |
Detalhes sobre a consulta atual. |
String |
180s |
|
INODE |
Inode Usage |
Uso do inode do disco. |
0% a 100% |
30s |
SCHEMA |
Schema Usage |
Uso do esquema do banco de dados. |
0% a 100% |
3600s |