Monitoramento de clusters usando o Cloud Eye
Função
Esta seção descreve como verificar as métricas de cluster no Cloud Eye. Ao monitorar as métricas de execução do cluster, você pode identificar o momento em que o cluster do banco de dados está anormal e analisar possíveis problemas de atividade com base nos logs do banco de dados, melhorando o desempenho do banco de dados. Esta seção descreve as métricas que podem ser monitoradas pelo Cloud Eye, bem como seus namespaces e dimensões. Você pode usar o console de gerenciamento ou as APIs fornecidas pelo Cloud Eye para consultar as métricas de monitoramento e os alarmes gerados pelo GaussDB(DWS).
Namespace
SYS.DWS
Métricas de monitoramento de cluster
Com as métricas de monitoramento do GaussDB(DWS) fornecidas pelo Cloud Eye, você pode obter informações sobre o status e o desempenho da execução do cluster. Essas informações fornecerão uma melhor compreensão das informações no nível do nó.
Tabela 1 descreve as métricas de monitoramento do GaussDB(DWS).
ID da métrica |
Nome |
Descrição |
Intervalo de valor |
Objeto monitorado |
Período de monitoramento (dados brutos) |
---|---|---|---|---|---|
dws001_shared_buffer_hit_ratio |
Cache Hit Ratio |
Percentual do volume de dados obtido da memória, expresso em porcentagem |
0% a 100% |
Cluster de armazém de dados |
4 minutos |
dws002_in_memory_sort_ratio |
In-memory Sort Ratio |
Percentual do volume de dados que é classificado na memória, expresso em porcentagem |
0% a 100% |
Cluster de armazém de dados |
4 minutos |
dws003_physical_reads |
File Reads |
Número total de leituras do arquivo de banco de dados |
> 0 |
Cluster de armazém de dados |
4 minutos |
dws004_physical_writes |
File Writes |
Número total de gravações do arquivo de banco de dados |
> 0 |
Cluster de armazém de dados |
4 minutos |
dws005_physical_reads_per_second |
File Reads per Second |
Número de leituras de arquivos de banco de dados por segundo |
≥ 0 |
Cluster de armazém de dados |
4 minutos |
dws006_physical_writes_per_second |
File Writes per Second |
Número de gravações de arquivo de banco de dados por segundo |
≥ 0 |
Cluster de armazém de dados |
4 minutos |
dws007_db_size |
Data Volume |
Volume total de dados da base de dados Unidade: MB |
≥ 0 MB |
Cluster de armazém de dados |
4 minutos |
dws008_active_sql_count |
Active SQL Count |
Número de SQLs ativas no banco de dados |
≥ 0 |
Cluster de armazém de dados |
4 minutos |
dws009_session_count |
Session Count |
Número de sessões que acessam o banco de dados |
≥ 0 |
Cluster de armazém de dados |
4 minutos |
dws010_cpu_usage |
CPU Usage |
Uso da CPU de cada nó em um cluster, em porcentagem |
0% a 100% |
Nó de armazém de dados |
1 minuto |
dws011_mem_usage |
Memory Usage |
Uso de memória de cada nó em um cluster, em porcentagem |
0% a 100% |
Nó de armazém de dados |
1 minuto |
dws012_iops |
IOPS |
Número de solicitações de I/O processadas por cada nó do cluster por segundo |
≥ 0 |
Nó de armazém de dados |
1 minuto |
dws013_bytes_in |
Network Input Throughput |
Entrada de dados para cada nó no cluster por segundo na rede Unidade: byte/s |
≥ 0 bytes/s |
Nó de armazém de dados |
1 minuto |
dws014_bytes_out |
Network Output Throughput |
Dados enviados para a rede por segundo de cada nó no cluster Unidade: byte/s |
≥ 0 bytes/s |
Nó de armazém de dados |
1 minuto |
dws015_disk_usage |
Disk Usage |
Uso de disco de cada nó em um cluster, em porcentagem |
0% a 100% |
Nó de armazém de dados |
1 minuto |
dws016_disk_total_size |
Total Disk Size |
Espaço total em disco de cada nó no cluster Unidade: GB |
100 a 2000 GB |
Nó de armazém de dados |
1 minuto |
dws017_disk_used_size |
Used Disk Space |
Espaço em disco usado de cada nó no cluster Unidade: GB |
0 a 3600 GB |
Nó de armazém de dados |
1 minuto |
dws018_disk_read_throughput |
Disk Read Throughput |
Volume de dados lido de cada disco no cluster por segundo Unidade: byte/s |
≥ 0 bytes/s |
Nó de armazém de dados |
1 minuto |
dws019_disk_write_throughput |
Disk Write Throughput |
Volume de dados gravado em cada disco no cluster por segundo Unidade: byte/s |
≥ 0 bytes/s |
Nó de armazém de dados |
1 minuto |
dws020_avg_disk_sec_per_read |
Average Time per Disk Read |
Tempo médio usado cada vez que um disco lê dados Unidade: segundo |
> 0s |
Nó de armazém de dados |
1 minuto |
dws021_avg_disk_sec_per_write |
Average Time per Disk Write |
Tempo médio usado cada vez que os dados são gravados em um disco Unidade: segundo |
> 0s |
Nó de armazém de dados |
1 minuto |
dws022_avg_disk_queue_length |
Average Disk Queue Length |
Comprimento médio da fila de I/O de um disco |
≥ 0 |
Nó de armazém de dados |
1 minuto |
dws_024_dn_diskio_util |
DN I/O usage |
Uso médio de I/O de disco de DNs em um cluster |
0% a 100% |
Instância do armazém de dados |
1 minuto |
Dimensões
Chave |
Valor |
---|---|
datastore_id |
ID do cluster de armazém de dados |
dws_instance_id |
ID do nó de armazém de dados |
Informações de monitoramento de cluster e nós
- Faça logon no console de gerenciamento do GaussDB(DWS).
- Exiba as informações do cluster. Na lista de clusters, clique em View Metric na coluna Operation onde um cluster específico reside. O console de gerenciamento do Cloud Eye é exibido. Por padrão, as informações de monitoramento de cluster no console de gerenciamento do Cloud Eye são exibidas.
Além disso, você pode especificar uma métrica de monitoramento específica e o intervalo de tempo para exibir a curva de desempenho.
- Exiba as informações do nó. Clique em para retornar ao console de gerenciamento do Cloud Eye. Na página de guia Data Warehouse Nodes no painel direito, você pode exibir as métricas de cada nó no cluster.
Além disso, você pode especificar uma métrica de monitoramento específica e o intervalo de tempo para exibir a curva de desempenho.
O Cloud Eye também suporta a capacidade de comparar as métricas de monitoramento de vários nós. Para mais detalhes, consulte Comparação das métricas de monitoramento de vários nós.
Comparação das métricas de monitoramento de vários nós
- No painel de navegação esquerdo do console de gerenciamento do Cloud Eye, escolha .
- Na página exibida, clique em Create Panel. Na caixa de diálogo exibida, insira o nome e clique em OK.
- Clique em Add Graph no canto superior direito.
- Na caixa de diálogo exibida, configure as métricas de título e monitoramento.
Você pode adicionar várias métricas de monitoramento clicando em Add Metric.
Figura 1 Adicionar um gráfico
A seguir, descrevemos como definir parâmetros se você quiser comparar o uso da CPU de dois nós.
Tabela 2 Exemplo de configuração Parâmetro
Exemplo de valor
Resource Type
DWS
Dimension
Data Warehouse Node
Monitored Object
dws-demo-dws-cn-cn-2-1
dws-demo-dws-cn-cn-1-1
dws-demo-dws-dn-1-1
Metric
CPU Usage
- Clique em OK.
Em seguida, você pode visualizar o gráfico de monitoramento correspondente na página Panels. Mova o cursor para o gráfico e clique em no canto superior direito para ampliar o gráfico e exibir dados detalhados de comparação de métricas.
Figura 2 Visualizar o gráfico de monitoramento
Criar regras de alarme
Definir regras de alarme do GaussDB(DWS) permite que você personalize os objetos monitorados e as políticas de notificação e determine o status de execução do seu GaussDB(DWS) a qualquer momento.
Uma regra de alarme do GaussDB(DWS) inclui o nome da regra de alarme, o objeto monitorado, a métrica, o limite, o intervalo de monitoramento e se deve enviar uma notificação. Esta seção descreve como definir regras de alarme do GaussDB(DWS).
- Faça logon no console de gerenciamento do GaussDB(DWS).
- No painel de navegação à esquerda, clique em Clusters.
- Localize a linha que contém o cluster de destino, clique em View Metric na coluna Operation para entrar no console de gerenciamento do Cloud Eye e exibir as informações de monitoramento do GaussDB(DWS).
O status do cluster de destino deve estar Available. Caso contrário, você não pode criar regras de alarme.
- No painel de navegação esquerdo do console de gerenciamento do Cloud Eye, escolha Alarm Management > Alarm Rules.
- Na página Alarm Rules, clique em Create Alarm Rule no canto superior direito.
- Na página Modify Alarm Rule, defina parâmetros como solicitado.
- Configure o nome e a descrição da regra.
- Configure os parâmetros do alarme conforme solicitado.
Figura 3 Selecionar o objeto a ser monitorado
Figura 4 Configurar a política de alarme
Tabela 3 Configurar parâmetros de alarme Parâmetro
Descrição
Exemplo de valor
Resource Type
Nome do recurso do serviço de nuvem para o qual a regra de alarme está configurada.
Data Warehouse Service
Dimension
Dimensão de métricas da regra de alarme. Você pode selecionar Data Warehouse Nodes ou Data Warehouses.
Data Warehouse Node
Monitoring Scope
Escopo do recurso ao qual se aplica uma regra de alarme. Selecione Specific resources e selecione um ou mais objetos de monitoramento. Selecione o ID da instância de cluster ou nó que você criou. Clique em para sincronizar os objetos de monitoramento com o painel direito.
Specific resources
Method
Selecione Use template ou Create manually conforme necessário.
- Se nenhum modelo de alarme estiver disponível, defina Method para Create manually e configure os parâmetros relacionados para criar uma regra de alarme.
- Se você tiver modelos de regras de alarme disponíveis, defina Method para Use template, para que você possa usar um modelo para criar rapidamente regras de alarme.
Create manually
Template
Este parâmetro é válido somente quando Use template é selecionado.
Selecione o modelo a ser importado. Se nenhum modelo de alarme estiver disponível, clique em Create Custom Template para criar um que atenda aos seus requisitos.
-
Alarm Policy
Este parâmetro é válido somente quando Create manually é selecionado.
Defina a política que dispara um alarme. Por exemplo, acione um alarme se o uso da CPU for igual ou maior que 80% por 3 períodos consecutivos.
Tabela 1 lista as métricas de monitoramento do GaussDB(DWS).
-
Alarm Severity
Gravidade de um alarme. Os valores válidos são Critical, Major, Minor e Informational.
Major
- Configure os parâmetros de notificação de alarme conforme solicitado.
Figura 5 Configurar notificações de alarme
Tabela 4 Configurar notificações de alarme Parâmetro
Descrição
Exemplo de valor
Alarm Notification
Se notificar os usuários quando os alarmes forem disparados. As notificações podem ser enviadas como e-mails ou mensagens de texto, ou solicitações HTTP/HTTPS enviadas aos servidores.
Você pode ativar (recomendado) ou desativar Alarm Notification.
Enable
Validity Period
O Cloud Eye envia notificações somente dentro do período de validade especificado na regra de alarme.
Por exemplo, se Validity Period estiver definido como 00:00-8:00, o Cloud Eye enviará notificações apenas entre 00:00-8:00.
-
Notification Object
Nome do tópico para o qual a notificação de alarme é enviada
Se você ativar Alarm Notification, precisará selecionar um tópico. Se não houver tópicos desejáveis disponíveis, crie um primeiro, após o que o serviço SMN será chamado. Para obter detalhes sobre como criar um tópico, consulte o Guia de usuário do Simple Message Notification.
Para obter detalhes sobre como criar um tópico, consulte o Guia de usuário do Simple Message Notification.
-
Trigger Condition
Condição para acionar o alarme. Você pode selecionar Generated alarm, Cleared alarm, ou ambos.
-
- Após a conclusão da configuração, clique em Next.
Depois que a regra de alarme for criada, se os dados de métrica atingirem o limite especificado, o Cloud Eye informará imediatamente que uma exceção ocorreu.
Transferência de dados para o OBS
Dados brutos de métricas são mantidos por dois dias no Cloud Eye. Você pode ativar o OBS e salvar os dados brutos no OBS para que eles possam ser salvos por mais tempo.
Para obter detalhes sobre como configurar a transferência de armazenamento do OBS, consulte "Exibição do histórico de alarmes > Configuração do armazenamento de dados do OBS" no Guia de usuário do Cloud Eye.