Monitoramento de clusters usando o Cloud Eye
Função
Esta seção descreve como verificar as métricas de cluster no Cloud Eye. Ao monitorar as métricas de execução do cluster, você pode identificar o momento em que o cluster do banco de dados está anormal e analisar possíveis problemas de atividade com base nos logs do banco de dados, melhorando o desempenho do banco de dados. Esta seção descreve as métricas que podem ser monitoradas pelo Cloud Eye, bem como namespaces e dimensões delas. Você pode usar o console de gerenciamento ou APIs fornecidas pelo Cloud Eye para consultar as métricas de monitoramento e os alarmes gerados pelo GaussDB.
Namespace
SYS.DWS
Métricas de monitoramento de cluster
Com as métricas de monitoramento do GaussDB(DWS) fornecidas pelo Cloud Eye, você pode obter informações sobre o status e o desempenho da execução do cluster. Essas informações fornecerão uma melhor compreensão das informações ao nível do nó.
A tabela a seguir descreve as métricas de monitoramento do GaussDB(DWS).
ID da métrica |
Nome |
Descrição |
Intervalo de valores |
Objeto monitorado |
Período de monitoramento (dados brutos) |
---|---|---|---|---|---|
dws001_shared_buffer_hit_ratio |
Taxa de acerto do cache |
Percentual do volume de dados obtido da memória, expresso em porcentagem |
0% a 100% |
Cluster de armazém de dados |
4 minutos |
dws002_in_memory_sort_ratio |
Taxa de classificação na memória |
Percentual do volume de dados que é classificado na memória, expresso em porcentagem |
0% a 100% |
Cluster de armazém de dados |
4 minutos |
dws003_physical_reads |
Leituras de arquivo |
Número total de leituras do arquivo de banco de dados |
> 0 |
Cluster de armazém de dados |
4 minutos |
dws004_physical_writes |
Gravações de arquivo |
Número total de gravações do arquivo de banco de dados |
> 0 |
Cluster de armazém de dados |
4 minutos |
dws005_physical_reads_per_second |
Leituras de arquivos por segundo |
Número de leituras de arquivos de banco de dados por segundo |
≥ 0 |
Cluster de armazém de dados |
4 minutos |
dws006_physical_writes_per_second |
Gravações de arquivo por segundo |
Número de gravações de arquivo de banco de dados por segundo |
≥ 0 |
Cluster de armazém de dados |
4 minutos |
dws007_db_size |
Volume de dados |
Tamanho total dos dados no banco de dados, em MB |
≥ 0 MB |
Cluster de armazém de dados |
4 minutos |
dws008_active_sql_count |
Número de SQLs ativos |
Número de SQLs ativos no banco de dados |
≥ 0 |
Cluster de armazém de dados |
4 minutos |
dws009_session_count |
Número de sessões |
Número de sessões que acessam o banco de dados |
≥ 0 |
Cluster de armazém de dados |
4 minutos |
dws010_cpu_usage |
Uso da CPU |
Uso da CPU de cada nó em um cluster, em porcentagem |
0% a 100% |
Nó de armazém de dados |
1 minuto |
dws011_mem_usage |
Uso da memória |
Uso de memória de cada nó em um cluster, em porcentagem |
0% a 100% |
Nó de armazém de dados |
1 minuto |
dws012_iops |
IOPS |
Número de solicitações de I/O processadas por cada nó do cluster por segundo |
≥ 0 |
Nó de armazém de dados |
1 minuto |
dws013_bytes_in |
Taxa de transferência de entrada da rede |
Entrada de dados para cada nó no cluster por segundo na rede Unidade: byte/s |
≥ 0 bytes/s |
Nó de armazém de dados |
1 minuto |
dws014_bytes_out |
Taxa de transferência de saída da rede |
Dados enviados para a rede por segundo de cada nó no cluster Unidade: byte/s |
≥ 0 bytes/s |
Nó de armazém de dados |
1 minuto |
dws015_disk_usage |
Uso do disco |
Uso de disco de cada nó em um cluster, em porcentagem |
0% a 100% |
Nó de armazém de dados |
1 minuto |
dws016_disk_total_size |
Tamanho total do disco |
Espaço total em disco de cada nó no cluster Unidade: GB |
100 a 2000 GB |
Nó de armazém de dados |
1 minuto |
dws017_disk_used_size |
Espaço em disco utilizado |
Espaço em disco usado de cada nó no cluster Unidade: GB |
0 a 3600 GB |
Nó de armazém de dados |
1 minuto |
dws018_disk_read_throughput |
Taxa de transferência de leitura do disco |
Volume de dados lido de cada disco no cluster por segundo Unidade: byte/s |
≥ 0 bytes/s |
Nó de armazém de dados |
1 minuto |
dws019_disk_write_throughput |
Taxa de transferência de gravação do disco |
Volume de dados gravados em cada disco no cluster por segundo Unidade: byte/s |
≥ 0 bytes/s |
Nó de armazém de dados |
1 minuto |
dws020_avg_disk_sec_per_read |
Tempo médio por leitura de disco |
Tempo médio usado cada vez que um disco lê dados Unidade: segundo |
> 0s |
Nó de armazém de dados |
1 minuto |
dws021_avg_disk_sec_per_write |
Tempo médio por gravação em disco |
Tempo médio usado cada vez que os dados são gravados em um disco Unidade: segundo |
> 0s |
Nó de armazém de dados |
1 minuto |
dws022_avg_disk_queue_length |
Comprimento médio da linha de espera do disco |
Comprimento médio da fila de I/O de um disco |
≥ 0 |
Nó de armazém de dados |
1 minuto |
Dimensões
Chave |
Valor |
---|---|
datastore_id |
ID do cluster de armazém de dados |
dws_instance_id |
ID do nó do armazém de dados |
Informações de monitoramento de cluster e nós
- Faça logon no console de gerenciamento do GaussDB(DWS).
- View the cluster information. Na lista de clusters, clique em View Metric na coluna Operation onde um cluster específico reside. O console de gerenciamento do Cloud Eye é exibido. Por padrão, as informações de monitoramento de cluster no console de gerenciamento do Cloud Eye são exibidas.
Além disso, você pode especificar uma métrica de monitoramento específica e o intervalo de tempo para exibir a curva de desempenho.
- View the node information. Clique em
para retornar ao console de gerenciamento do Cloud Eye. Na página de guia Data Warehouse Nodes no painel direito, você pode exibir as métricas de cada nó no cluster.
Além disso, você pode especificar uma métrica de monitoramento específica e o intervalo de tempo para exibir a curva de desempenho.
O Cloud Eye também suporta a capacidade de comparar as métricas de monitoramento de vários nós. Para mais detalhes, consulte Comparação das métricas de monitoramento de vários nós.
Comparação das métricas de monitoramento de vários nós
- No painel de navegação esquerdo do console de gerenciamento do Cloud Eye, escolha .
- Na página exibida, clique em Create Panel. Na caixa de diálogo exibida, insira o nome e clique em OK.
- Clique em Add Graph no canto superior direito.
- Na caixa de diálogo exibida, configure as métricas de título e monitoramento.
Você pode adicionar várias métricas de monitoramento clicando em Add Metric.
Figura 1 Adição de um gráficoA seguir, descrevemos como definir parâmetros se você quiser comparar o uso da CPU de dois nós.
Tabela 2 Exemplo de configuração Parâmetro
Exemplo de valor
Resource Type
DWS
Dimension
Data Warehouse Node
Monitored Object
dws-demo-dws-cn-cn-2-1
dws-demo-dws-cn-cn-1-1
dws-demo-dws-dn-1-1
Metric
CPU Usage
- Clique em OK.
Em seguida, você pode visualizar o gráfico de monitoramento correspondente na página Panels. Mova o cursor para o gráfico, e clique em
no canto superior direito para ampliar o gráfico e exibir dados detalhados de comparação de métricas.
Figura 2 Exibição do gráfico de monitoramento
Criação de regras de alarme
Definição de regras de alarme do GaussDB(DWS) permite que você personalize os objetos monitorados e as políticas de notificação e determine o status de execução do seu GaussDB(DWS) a qualquer momento.
Uma regra de alarme do GaussDB(DWS) inclui o nome da regra de alarme, o objeto monitorado, a métrica, o limite, o intervalo de monitoramento e se enviar uma notificação. Esta seção descreve como definir regras de alarme do GaussDB(DWS).
- Faça logon no console de gerenciamento do GaussDB(DWS).
- No painel de navegação à esquerda, clique em Clusters.
- Localize a linha que contém o cluster de destino, clique em View Metric na coluna Operation para entrar no console de gerenciamento do Cloud Eye e exibir as informações de monitoramento do GaussDB(DWS).
O status do cluster de destino deve estar Available. Caso contrário, você não pode criar regras de alarme.
- No painel de navegação esquerdo do console de gerenciamento do Cloud Eye, escolha Alarm Management > Alarm Rules.
- Na página Alarm Rules, clique em Create Alarm Rule no canto superior direito.
- Na página Create Alarm Rule, defina parâmetros como solicitado.
- Configure o nome e a descrição da regra.
- Configure os parâmetros de alarme conforme solicitado.
Figura 3 Seleção do objeto a ser monitoradoFigura 4 Configuração da política de alarme
Tabela 3 Configuração de parâmetros de alarme Parâmetro
Descrição
Exemplo de valor
Resource Type
Nome do recurso do serviço de nuvem para o qual a regra de alarme está configurada.
Data Warehouse Service
Dimension
Dimensão métrica da regra de alarme. Você pode selecionar Data Warehouse Nodes ou Data Warehouses.
Data Warehouse Node
Monitoring Scope
Escopo do recurso ao qual se aplica uma regra de alarme. Selecione Specific resources e selecione um ou mais objetos de monitoramento. Selecione o ID da instância de cluster ou nó que você criou. Clique em
para sincronizar os objetos de monitoramento com o painel direito.
Specific resources
Method
Selecione Use template ou Create manually conforme necessário.
- Se nenhum modelo de alarme estiver disponível, defina Method para Create manually e configure os parâmetros relacionados para criar uma regra de alarme.
- Se você tiver modelos de regras de alarme disponíveis, defina Method para Use template, para que você possa usar um modelo para criar rapidamente regras de alarme.
Create manually
Template
Este parâmetro é válido somente quando Use template é selecionado.
Selecione o modelo a ser importado. Se nenhum modelo de alarme estiver disponível, clique em Create Custom Template para criar um que atenda aos seus requisitos.
-
Alarm Policy
Este parâmetro é válido somente quando Create manually é selecionado.
Defina a política que dispara um alarme. Por exemplo, acione um alarme se o uso da CPU for igual ou maior que 80% por 3 períodos consecutivos.
Tabela 1 descreve as métricas de monitoramento do GaussDB(DWS).
-
Alarm Severity
Gravidade de um alarme. Os valores válidos são Critical, Major, Minor e Informational.
Major
- Configure os parâmetros de notificação de alarme conforme solicitado.
Figura 5 Configuração de notificações de alarme
Tabela 4 Configuração de notificações de alarme Parâmetro
Descrição
Exemplo de valor
Alarm Notification
Se notificar os usuários quando os alarmes forem disparados. As notificações podem ser enviadas como e-mails ou mensagens de texto, ou solicitações HTTP/HTTPS enviadas aos servidores.
Você pode ativar (recomendado) ou desativar Alarm Notification.
Ativar
Validity Period
O Cloud Eye envia notificações somente dentro do período de validade especificado na regra de alarme.
Por exemplo, se Validity Period estiver definido como 00:00-8:00, o Cloud Eye enviará notificações apenas entre 00:00-8:00.
-
Notification Object
Nome do tópico para o qual a notificação de alarme é enviada
Se você ativar Alarm Notification, precisará selecionar um tópico. Se nenhum tópico desejado estiver disponível, crie um primeiro, após o que o serviço SMN é chamado. Para obter detalhes sobre como criar um tópico, consulte o Guia de usuário da Simple Message Notification.
-
Trigger Condition
Condição para acionar o alarme. Você pode selecionar Generated alarm, Cleared alarm ou ambos.
-
- Após a conclusão da configuração, clique em Next.
Depois que a regra de alarme for criada, se os dados de métrica atingirem o limite especificado, o Cloud Eye informará imediatamente que ocorreu uma exceção.
Transferência de dados para o OBS
Dados brutos de métricas são mantidos por dois dias no Cloud Eye. Você pode ativar o OBS e salvar os dados brutos no OBS para que eles possam ser salvos por mais tempo.
Para obter detalhes sobre como configurar a transferência de armazenamento do OBS, consulte "Exibição do histórico de alarmes > Configuração do armazenamento de dados do OBS" no Guia de usuário do Cloud Eye.