Métricas de monitoramento
Você pode verificar o status e os recursos disponíveis de um cluster e aprender sobre seu consumo de recursos em tempo real por meio dos itens de monitoramento do GaussDB(DWS).
Tabela 1 descreve as métricas de monitoramento do GaussDB(DWS).
Objeto monitorado |
Métrica |
Descrição |
Intervalo de valor |
Período de monitoramento (dados brutos) |
---|---|---|---|---|
Visão geral do cluster |
Status do cluster |
Status de um cluster. |
Normal/anormal/degradado |
30s |
Nós |
Número de nós disponíveis e número total de nós (disponível/total) em um cluster. |
≥ 0 |
60s |
|
CNs |
Número de CNs em um cluster |
≥ 0 |
60s |
|
Bancos de dados |
Número de bancos de dados criados em um cluster. |
≥ 0 |
90s |
|
Consumo de recursos |
Uso da CPU |
Uso médio da CPU em tempo real de todos os nós em um cluster. |
0% até 100% |
30s |
Uso da memória |
Uso médio de memória em tempo real de todos os nós em um cluster. |
0% até 100% |
30s |
|
Uso do disco |
Uso médio do disco em tempo real de todos os nós em um cluster. |
0% até 100% |
30s |
|
I/O de disco |
Média de I/O de disco em tempo real de todos os nós em um cluster. |
≥ 0 KB/s |
30s |
|
I/O de rede |
Média de I/O de rede em tempo real de todas as NICs em um cluster. |
≥ 0 KB/s |
30s |
|
As 5 principais consultas de consumo de tempo |
ID da consulta |
ID de uma consulta, que é gerada automaticamente pelo banco de dados. |
≥ 0 |
180s |
Instruções de SQL |
Instruções de consulta executada por um usuário. |
String de caracteres |
180s |
|
Tempo de execução |
Tempo de execução de uma instrução de consulta (unidade: ms). |
≥ 0 ms |
180s |
|
As 5 principais consultas com a maioria dos dados gravados em disco |
ID da consulta |
ID de uma consulta, que é gerada automaticamente pelo banco de dados. |
≥ 0 |
180s |
Instruções de SQL |
Instruções de consulta executada por um usuário. |
String de caracteres |
180s |
|
Dados gravados no disco |
Dados a serem gravados em discos depois que um usuário executa uma instrução (unidade: MB). |
≥ 0 MB |
180s |
|
Métricas de recursos do cluster |
Uso da CPU |
Uso médio da CPU e taxa de inclinação de todos os nós no cluster. A fórmula para calcular o desvio é (max-avg)/max. |
0% até 100% |
30s |
Uso da memória |
Uso médio de memória e taxa de inclinação de todos os nós no cluster. A fórmula para calcular o desvio é (max-avg)/max. |
0% até 100% |
30s |
|
Uso do disco |
Uso médio e taxa de inclinação de todos os discos no cluster. A fórmula para calcular o desvio é (max-avg)/max. |
0% até 100% |
30s |
|
Uso de I/O de disco |
Uso médio de I/O e taxa de distorção de todos os discos no cluster. A fórmula para calcular o desvio é (max-avg)/max. |
0% até 100% |
30s |
|
Utilização de I/O de rede |
Uso médio de I/O e taxa de distorção de todas as NICs no cluster. A fórmula para calcular o desvio é (max-avg)/max. |
0% até 100% |
30s |
|
Métricas chave do banco de dados |
Status do cluster |
Status de execução do cluster. |
Normal/degradado/anormal |
30s |
CNs anormais do cluster |
Número de CNs anormais no cluster |
≥ 0 |
60s |
|
Cluster somente leitura |
Se o cluster está no estado somente leitura |
Sim/Não |
30s |
|
Sessões simultâneas |
Número de sessões simultâneas em um cluster dentro de um período especificado. |
≥ 0 |
30s |
|
Consultas simultâneas |
Número de consultas simultâneas em um cluster dentro de um período especificado. |
≥ 0 |
30s |
|
Monitoramento de nó-visão geral |
Nome do nó |
Nome de um nó em um cluster. |
String de caracteres |
30s |
Uso da CPU |
Uso da CPU de um host. |
0% até 100% |
30s |
|
Uso da memória |
Uso de memória de um host. |
0% até 100% |
30s |
|
Uso médio do disco (%) |
Uso do disco de um host. |
0% até 100% |
30s |
|
Endereço de IP |
Endereço de IP de serviço de um host. |
String de caracteres |
30s |
|
I/O de disco |
I/O de disco de um host (unidade: KB/s) |
≥ 0 KB/s |
30s |
|
Taxa de retransmissão da pilha de protocolo TCP |
Taxa de retransmissão de pacotes TCP por unidade de tempo. |
0% até 100% |
30s |
|
Status |
Status de execução de um host |
On-line/off-line |
30s |
|
Monitoramento de nós-discos |
Nome do nó |
Nome de um nó em um cluster. |
String de caracteres |
30s |
Nome de disco |
Nome de um disco em um host. |
String de caracteres |
30s |
|
Capacidade do disco |
Capacidade do disco do host (unidade: GB) |
≥ 0 GB |
30s |
|
Uso do disco |
Uso do disco de um host. |
0% até 100% |
30s |
|
Taxa de leitura de disco |
Taxa de leitura do disco do host (unidade: KB/s) |
≥ 0 KB/s |
30s |
|
Taxa de gravação do disco |
Taxa de gravação em disco do host (unidade: KB/s) |
≥ 0 KB/s |
30s |
|
Tempo de espera de I/O (espera, ms) |
Tempo médio de espera para cada solicitação de I/O (unidade: ms) |
≥ 0 ms |
30s |
|
Tempo de Serviço de I/O (svctm, ms) |
Tempo médio de processamento para cada solicitação de I/O (unidade: ms) |
até 0 ms |
30s |
|
Utilitário de I/O (útil, %) |
Uso de I/O de disco de um host. |
0% até 100% |
30s |
|
Monitoramento de nó-rede |
Nome do nó |
Nome de um nó em um cluster. |
String de caracteres |
30s |
Nome da NIC |
Nome da NIC em um host. |
String de caracteres |
30s |
|
Status da NIC |
Status da NIC. |
para cima/para baixo |
30s |
|
Velocidade da NIC |
Taxa de trabalho de uma NIC, em Mbit/s. |
≥ 0 |
30s |
|
Pacotes recebidos |
Número de pacotes recebidos de uma NIC. |
≥ 0 |
30s |
|
Pacotes enviados |
Número de pacotes enviados de uma NIC. |
≥ 0 |
30s |
|
Pacotes perdidos recebidos |
Número de pacotes perdidos recebidos de uma NIC. |
≥ 0 |
30s |
|
Taxa de recebimento |
Número de bytes recebidos por uma NIC por unidade de tempo (KB/s). |
≥ 0 KB/s |
30s |
|
Taxa de transmissão |
Número de bytes enviados por uma NIC por unidade de tempo (unidade: KB/s) |
≥ 0 KB/s |
30s |
|
Monitoramento de banco de dados |
Nome do banco de dados |
Nome do banco de dados criado por um usuário em um cluster. |
String de caracteres |
60s |
Uso |
Capacidade utilizada da base de dados actual (unidade: GB). |
≥ 0 GB |
86400s |
|
Usuários |
Número de usuários no banco de dados atual. |
≥ 0 |
30s |
|
Sessões |
Número de sessões no banco de dados atual. |
≥ 0 |
30s |
|
Aplicativos |
Número de aplicativos no banco de dados atual. |
≥ 0 |
30s |
|
Consultas |
Número de consultas ativas no banco de dados atual. |
≥ 0 |
30s |
|
Varredura de linhas |
Número de linhas retornadas pela consulta de varredura de tabela completa no banco de dados atual. |
≥ 0 |
60s |
|
Linhas de consulta de índice |
Número de linhas retornadas pela consulta de índice no banco de dados atual. |
≥ 0 |
60s |
|
Linhas inseridas |
Número de linhas inseridas no banco de dados atual. |
≥ 0 |
60s |
|
Linhas atualizadas |
Número de linhas atualizadas no banco de dados atual. |
≥ 0 |
60s |
|
Linhas excluídas |
Número de linhas excluídas do banco de dados atual. |
≥ 0 |
60s |
|
Transações executadas |
Número de execuções de transações no banco de dados atual. |
≥ 0 |
60s |
|
Rollbacks da transação |
Número de transações no banco de dados atual que foram revertidas. |
≥ 0 |
60s |
|
Deadlocks |
Número de deadlocks detectados no banco de dados atual. |
≥ 0 |
60s |
|
Tempos de leitura física |
Número de blocos de disco lidos no banco de dados atual. |
≥ 0 |
60s |
|
Tempos de leitura lógicos |
Número de vezes que os blocos de disco são encontrados no cache. |
≥ 0 |
60s |
|
Arquivos temporários |
Número de arquivos temporários criados no banco de dados atual. |
≥ 0 |
60s |
|
Capacidade de arquivo temporário |
Tamanho dos arquivos temporários gravados pelo banco de dados atual, em GB. |
≥ 0 |
60s |
|
Monitoramento de desempenho |
Uso da CPU do cluster |
Tendência histórica do uso médio da CPU e inclinação de todos os nós no cluster. A fórmula para calcular o desvio é (max-avg)/max. |
0% até 100% |
30s |
Uso da memória do cluster |
Tendência histórica do uso médio de memória e inclinação de todos os nós no cluster. A fórmula para calcular o desvio é (max-avg)/max. |
0% até 100% |
30s |
|
Uso do disco do cluster |
Tendência histórica do uso médio de disco e inclinação de todos os nós no cluster. A fórmula para calcular o desvio é (max-avg)/max. |
0% até 100% |
30s |
|
I/O de disco de cluster |
Tendência histórica da I/O média de disco e inclinação de todos os discos no cluster. A fórmula para calcular o desvio é (max-avg)/max. |
0% até 100% |
30s |
|
I/O de rede de cluster |
Tendência histórica do valor médio de I/O da rede e do desvio de todas as NICs no cluster. A fórmula para calcular o desvio é (max-avg)/max. |
0% até 100% |
30s |
|
Status do cluster |
Tendência histórica do status do cluster. |
Normal/anormal/degradado |
30s |
|
Cluster somente leitura |
Tendência histórica da tendência de alteração de status somente leitura do cluster. |
Sim/Não |
30s |
|
CNs anormais do cluster |
Tendência histórica do número de CNs anormais no cluster. |
≥ 0 |
60s |
|
DNs anormais do cluster |
Tendência histórica do número de DNs anormais no cluster. |
≥ 0 |
60s |
|
Uso de DNs da CPU de cluster |
Tendências históricas do uso médio da CPU e das alterações da taxa de distorção de todos os DNs no cluster. A fórmula para calcular a razão de inclinação é (max – avg)/max. |
0% até 100% |
60s |
|
Sessões de cluster |
Tendência histórica do número de sessões em um cluster. |
≥ 0 |
30s |
|
Consultas de cluster |
Tendência de mudança histórica do número de consultas no cluster. |
≥ 0 |
30s |
|
Deadlocks do cluster |
Tendência histórica do número de deadlocks em um cluster. |
≥ 0 |
60s |
|
TPS de cluster |
Número médio de transações por segundo de todos os bancos de dados em um cluster. Fórmula: (delta_xact_commit + delta_xact_rollback)/current_collect_rate |
≥0 |
60s |
|
QPS de cluster |
Número médio de solicitações simultâneas por segundo de todos os bancos de dados em um cluster. Fórmula: delta_query_count/current_collect_rate |
≥ 0 |
60s |
|
Sessões de banco de dados |
Tendência histórica do número de sessões em um único banco de dados em um cluster. |
≥ 0 |
30s |
|
Consultas de banco de dados |
Tendência histórica do número de consultas em um único banco de dados em um cluster. |
≥ 0 |
30s |
|
Transações submetidas ao banco de dados |
Tendência histórica do número de transações submetidas em um único banco de dados em um cluster. |
≥ 0 |
60s |
|
Transações de rollback do banco de dados |
Tendência histórica do número de transações de rollback em um único banco de dados em um cluster. |
≥ 0 |
60s |
|
Linhas de varredura de cluster |
Tendência histórica do número de linhas retornadas por uma varredura completa de tabela em um único banco de dados em um cluster. |
≥ 0 |
60s |
|
Linhas de consulta do índice do banco de dados |
Tendência histórica do número de linhas retornadas por uma consulta de índice em um único banco de dados de um cluster. |
≥ 0 |
60s |
|
Linhas inseridas no banco de dados |
Tendência histórica do número de linhas inseridas em um único banco de dados em um cluster. |
≥ 0 |
60s |
|
Linhas atualizadas do banco de dados |
Tendência histórica do número de linhas atualizadas em um único banco de dados em um cluster. |
≥ 0 |
60s |
|
Linhas excluídas do banco de dados |
Tendência histórica do número de linhas excluídas em um único banco de dados em um cluster. |
≥ 0 |
60s |
|
Capacidade do banco de dados |
Tendência histórica da capacidade em um único banco de dados em um cluster. |
≥ 0 |
86400s |
|
Comprimento do banco de dados da fila de espera da solicitação |
Tendência histórica do comprimento da fila de espera em um único banco de dados em um cluster. |
≥ 0 |
30s |
|
TPS de banco de dados |
Número de transações por segundo de cada banco de dados em um cluster. Fórmula: (delta_xact_commit + delta_xact_rollback)/current_collect_rate. |
≥0 |
60s |
|
Sessão ao vivo |
ID da sessão |
ID da sessão atual (ID do thread de consulta). |
String de caracteres |
30s |
Nome de usuário |
Nome do usuário que executa a sessão atual. |
String de caracteres |
30s |
|
Nome do banco de dados |
Nome do banco de dados conectado à sessão atual. |
String de caracteres |
30s |
|
Duração da seção |
Duração da sessão atual (unidade: ms). |
≥ 0 ms |
30s |
|
Nome da aplicação |
Nome do aplicativo que cria a sessão atual. |
String de caracteres |
30s |
|
Consultas |
Número de instruções de SQL executadas na sessão atual. |
≥ 0 |
30s |
|
Duração da consulta mais recente |
Duração da execução da instrução SQL anterior na sessão atual. |
≥ 0 ms |
30s |
|
Endereço de IP do cliente |
Endereço de IP do cliente que inicia a sessão atual. |
String de caracteres |
30s |
|
CN conectado |
CN conectado da sessão atual. |
String de caracteres |
30s |
|
Status da sessão |
Status de execução da sessão atual. |
Em execução/inativo/tentar novamente |
30s |
|
Consulta em tempo real |
ID da consulta |
Consulta ID de uma instrução de consulta atual, que é um identificador exclusivo alocado pelo kernel para cada instrução de consulta. |
String de caracteres |
30s |
Nome de usuário |
Nome do usuário que submete a instrução de consulta atual. |
String de caracteres |
30s |
|
Nome do banco de dados |
Nome do banco de dados correspondente à instrução de consulta atual. |
String de caracteres |
30s |
|
Nome da aplicação |
Nome do aplicativo correspondente à instrução de consulta atual. |
String de caracteres |
30s |
|
Fila de carga de trabalho |
Nome da fila de carga de trabalho que carrega a instrução de consulta atual. |
String de caracteres |
30s |
|
Enviado |
Timestamp quando a instrução de consulta atual é enviada. |
String de caracteres |
30s |
|
Tempo de bloqueio |
Tempo de espera antes da instrução de consulta atual ser executada, em ms. |
≥ 0 |
30s |
|
Tempo de execução |
Tempo de execução da instrução de consulta atual, em ms. |
≥ 0 |
30s |
|
Tempo da CPU |
Tempo total de CPU gasto pela instrução de consulta atual em todos os DNs, em ms. |
≥ 0 |
30s |
|
Desvio de tempo da CPU |
Desvio de tempo de CPU da instrução de consulta atual entre todos os DNs. |
0% até 100% |
30s |
|
Dados médios escritos |
Tamanho médio de dados da instrução de consulta atual liberados em discos em todos os DNs, em MB. |
≥ 0 |
30s |
|
Instroções |
Instroções de consulta que está sendo executada. |
String de caracteres |
30s |
|
CN conectado |
Nome do CN que submete a instrução de consulta atual. |
String de caracteres |
30s |
|
Endereço de IP do cliente |
Endereço de IP do cliente que submete a instrução de consulta atual. |
String de caracteres |
30s |
|
Pista |
Pista onde a instrução de consulta atual está localizada. |
Pista rápida/pista lenta |
30s |
|
Status da consulta |
Status da consulta da instrução que está sendo executada. |
String de caracteres |
30s |
|
ID da sessão |
ID da sessão da instrução de consulta atual, que é um identificador exclusivo alocado pelo kernel para cada conexão do cliente. |
String de caracteres |
30s |
|
Status do enfileiramento |
Status da execução da consulta atual no banco de dados, indicando se a consulta está enfileirada na fila de carga de trabalho. |
Sim/Não |
30s |
|
Consulta histórica |
ID da consulta |
ID de consulta de uma instrução de consulta, que é um identificador exclusivo alocado pelo kernel para cada instrução de consulta. |
String de caracteres |
180s |
Nome de usuário |
Nome do usuário que envia uma instrução de consulta. |
String de caracteres |
180s |
|
Nome da aplicação |
Nome do aplicativo correspondente a uma instrução de consulta. |
String de caracteres |
180s |
|
Nome do banco de dados |
Nome do banco de dados correspondente a uma instrução de consulta. |
String de caracteres |
180s |
|
Fila de carga de trabalho |
Nome da fila de carga de trabalho que carrega a instrução de consulta atual. |
String de caracteres |
180s |
|
Submetido |
Timestamp quando uma instrução de consulta é submetida. |
String de caracteres |
180s |
|
Tempo de bloqueio |
Tempo de espera antes da instrução de consulta ser executada, em ms. |
≥ 0 |
180s |
|
Tempo de execução |
Tempo de execução da instrução de consulta, em ms. |
≥ 0 |
180s |
|
Tempo da CPU |
Tempo total de CPU gasto pela instrução de consulta em todos os DNs, em ms. |
≥ 0 |
180s |
|
Desvio de tempo da CPU |
Desvio de tempo de CPU de uma instrução de consulta executada em todos os DNs. |
0% até 100% |
180s |
|
Dados médios escritos |
Tamanho médio de dados da instrução de consulta liberados em discos em todos os DNs, em MB. |
≥ 0 |
180s |
|
Instroções |
Instroções de consulta a serem analisadas |
String de caracteres |
180s |
|
Monitoramento de instância lenta |
Instância lenta |
Número de instâncias lentas detectadas no momento atual. |
≥ 0 |
240s |
Detectado |
Hora em que uma instância lenta é detectada pela primeira vez. |
String de caracteres |
240s |
|
Nome do nó |
Nome do nó onde a instância lenta é implantada. |
String de caracteres |
240s |
|
Instância |
Nome de uma instância. |
String de caracteres |
240s |
|
Detecções de nó lento (dentro de 24 horas) |
Número de vezes que uma instância lenta é detectada dentro de 24 horas. |
≥ 0 |
240s |
|
Monitoramento da fila da carga de trabalho |
Fila de carga de trabalho |
Nome da fila de carga de trabalho no cluster. |
String de caracteres |
120s |
Uso da CPU |
Uso da CPU em tempo real da fila de carga de trabalho. |
0% até 100% |
120s |
|
Recurso da CPU |
Cotas de uso de CPU da fila de carga de trabalho. |
0% até 100% |
120s |
|
Consultas curtas simultâneas em tempo real |
Número de consultas simples simultâneas em tempo real em uma fila de carga de trabalho. |
≥ 0 |
120s |
|
Consultas curtas simultâneas |
Quotas de consulta simples simultâneas de uma fila de carga de trabalho. |
≥ 0 |
120s |
|
Consultas simultâneas em tempo real |
Número de consultas complexas simultâneas em tempo real em uma fila de carga de trabalho. |
≥ 0 |
120s |
|
Consulta de concorrência |
Cotas de consulta complexas simultâneas de uma fila de carga de trabalho. |
≥ 0 |
120s |
|
Armazenamento |
Cota de armazenamento da fila de carga de trabalho. |
≥ 0 |
120s |
|
Uso do disco |
Uso do disco da fila de carga de trabalho. |
0% até 100% |
120s |
|
Memória |
Cota de memória da fila de carga de trabalho. |
≥ 0 |
120s |
|
Uso da memória |
Uso de memória da fila de carga de trabalho. |
0% até 100% |
120s |
|
Consultas em espera |
Usuário |
Nome do usuário das consultas em espera |
String de caracteres |
120s |
Aplicativo |
Nome do aplicativo a ser consultado. |
String de caracteres |
120s |
|
Banco de dados |
Nome do banco de dados a ser consultado. |
String de caracteres |
120s |
|
Status do enfileiramento |
Status de execução de uma consulta no banco de dados (CCN/CN/DN). |
String de caracteres |
120s |
|
Tempo de espera |
Tempo de espera por uma consulta em espera (unidade: ms). |
≥ 0 ms |
120s |
|
Fila de carga de trabalho |
Fila de carga de trabalho à qual a consulta em espera pertence. |
String de caracteres |
120s |
|
Instruções |
Instruções de consulta para o status de espera. |
String de caracteres |
120s |
|
Consultas de quebra de circuito |
ID da consulta |
ID de consulta da instrução de consulta de quebra de circuito. |
String de caracteres |
120s |
Instroções de consulta |
Instroções de consulta para o status de interrupção do circuito. |
String de caracteres |
120s |
|
Tempo de bloqueio |
O tempo de bloqueio antes que a instrução de consulta acione a quebra de circuito, em ms. |
≥ 0 |
120s |
|
Tempo de execução |
Tempo de execução antes que a instrução de consulta desencadeie a quebra de circuito, em ms. |
≥ 0 |
120s |
|
Tempo da CPU |
Tempo médio de CPU consumido por cada DN antes que a instrução de consulta acione a quebra de circuito, em ms. |
≥ 0 |
120s |
|
Inclinação da CPU |
Taxa de distorção do tempo de CPU consumido por cada DN antes da instrução de consulta disparar a quebra de circuito. |
0% até 100% |
120s |
|
Tratamento de exceções |
O método de manipulação após a instrução de consulta disparar a quebra de circuito. |
Abortar/degradar |
120s |
|
Status |
Status de tratamento de quebra de circuito de uma instrução de consulta. |
Na execução/concluído |
120s |
|
Ajuste de SQL |
ID da consulta |
Endereço IP da consulta atual (ID da lógica da consulta). |
String de caracteres |
180s |
Banco de dados |
Nome do banco de dados onde a consulta atual é executada. |
String de caracteres |
180s |
|
Nome do esquema |
Nome do esquema de consulta atual. |
String de caracteres |
180s |
|
Nome de usuário |
Nome do usuário que executa a consulta. |
String de caracteres |
180s |
|
Cliente |
Nome do cliente que inicia a consulta atual. |
String de caracteres |
180s |
|
Endereço de IP do cliente |
Endereço de IP do cliente que inicia a consulta atual. |
String de caracteres |
180s |
|
Tempo de corrida |
Tempo de execução da consulta atual, em ms. |
≥ 0 |
180s |
|
Tempo da CPU |
Tempo de CPU da consulta atual, em ms. |
≥ 0 |
180s |
|
Dimensionamento iniciada |
Hora de início da consulta atual. |
Timestamp |
180s |
|
Concluído |
Hora de término da consulta atual. |
Timestamp |
180s |
|
Detalhes |
Detalhes sobre a consulta atual. |
String de caracteres |
180s |
|
INODE |
Uso do inode |
Uso do inode do disco. |
0% até 100% |
30s |
SCHEMA |
Utilização do esquema |
Uso do esquema do banco de dados. |
0% até 100% |
3600s |
Tipo |
Métrica |
Cluster de ECS |
Cluster de BMS |
---|---|---|---|
Rede |
Velocidade nominal da NIC |
Nenhum |
100/1000/10000/50000M |
Modo de trabalho da NIC (duplex) |
Nenhum |
cheio/meio |