Passo 5: configurar regras de alarme
Esta seção descreve as regras de alarme de algumas métricas e como configurá-las. Em serviços reais, é recomendável configurar regras de alarme para métricas com base nas seguintes políticas de alarme.
Approach Upper Limit na tabela a seguir indica se o desempenho do recurso atual está próximo do limite superior. Se o desempenho estiver próximo do limite superior, o desempenho suportado pelo recurso atual é o limite de alarme definido na política de alarmes. Se o desempenho continuar a aumentar, os serviços podem se tornar anormais.
ID da métrica |
Métrica |
Política de alarme |
Descrição |
Sugestão de tratamento |
---|---|---|---|---|
broker_disk_usage |
Disk Capacity Usage |
Limite de alarme: valor original > 80% Número de períodos consecutivos: 1 Gravidade do alarme: crítica |
Uso do disco da VM do Kafka |
Modifique o espaço de armazenamento da instância. Para obter detalhes, consulte Modificação de especificações de instância. |
broker_cpu_core_load |
Average Load per CPU Core |
Limite de alarme: valor original > 2 Número de períodos consecutivos: 3 Gravidade do alarme: grave |
Carga média de cada núcleo de CPU da VM de Kafka. |
Verifique se a métrica está se aproximando ou excedendo o limite de alarme há muito tempo. Se sim, modifique a largura de banda ou o número de brokers da instância. Para obter detalhes, consulte Modificação de especificações de instância. |
broker_memory_usage |
Memory Usage |
Limite de alarme: valor original > 90% Número de períodos consecutivos: 3 Gravidade do alarme: crítica |
Uso de memória da VM de Kafka. |
Modifique a largura de banda ou o número de brokers da instância. Para obter detalhes, consulte Modificação de especificações de instância. |
current_partitions |
Partitions |
Limite de alarme: valor original > 90% do número máximo permitido de partições. O limite de partição varia dependendo das especificações da instância. Para obter detalhes, consulte Especificações. Número de períodos consecutivos: 1 Gravidade do alarme: grave |
Número de partições usadas na instância. |
Se novos tópicos forem necessários, modifique a largura de banda ou o número de brokers da instância ou divida o serviço em várias instâncias. Para obter detalhes sobre como modificar a largura de banda da instância ou o número de brokers, consulte Modificação das especificações da instância. |
broker_cpu_usage |
CPU Usage |
Limite de alarme: valor original > 90% Número de períodos consecutivos: 3 Gravidade do alarme: grave |
Uso da CPU da VM de Kafka. |
Verifique se a métrica está se aproximando ou excedendo o limite de alarme há muito tempo. Se sim, modifique a largura de banda ou o número de brokers da instância. Para obter detalhes, consulte Modificação de especificações de instância. |
group_msgs |
Accumulated Messages |
Limite de alarme: valor original > 90% do limite superior. O limite superior é personalizado. Número de períodos consecutivos: 1 Gravidade do alarme: grave |
Número total de mensagens acumuladas em todos os grupos de consumidores da instância |
Exclua grupos de consumidores ociosos, se houver. Você também pode acelerar a recuperação de mensagens, por exemplo, aumentando o número de consumidores. |
topic_messages_remained |
Topic Available Messages |
Limite de alarme: valor original > 90% do limite superior. O limite superior é personalizado. Número de períodos consecutivos: 1 Gravidade do alarme: grave |
Número de mensagens restantes que podem ser recuperadas do tópico especificado no grupo de consumidores. |
Verifique se a lógica do código do consumidor está correta, por exemplo, verificando se o consumidor deixa de consumir mensagens devido a uma exceção. Você também pode acelerar a recuperação de mensagens, por exemplo, adicionando consumidores de tópicos. Certifique-se de que o número de partições seja maior ou igual ao número de consumidores. |
Procedimento
- Efetue logon no console do Kafka e selecione a região onde a instância do Kafka está localizada. A lista de instâncias do Kafka é exibida.
- Exiba as métricas da instância usando um dos seguintes métodos:
- Clique em View Metric ao lado do nome da instância do Kafka para ir para a página de monitoramento de instâncias do console do Cloud Eye.
- Clique na instância de Kafka desejada para visualizar seus detalhes. No painel de navegação, escolha Monitoring.
- Passe o ponteiro do mouse sobre uma métrica e clique em para criar uma regra de alarme para a métrica.
- Especifique os detalhes do alarme.
Para obter mais informações sobre como criar regras de alarme, consulte Criação de uma regra de alarme.
- Defina o nome e a descrição do alarme.
- Especifique a política de alarme e a Gravidade do alarme.
Conforme mostrado na figura a seguir, se o uso da capacidade original do disco exceder 85% por três períodos consecutivos, um alarme será gerado. Se o alarme não for tratado a tempo, é enviada uma notificação de alarme.
Figura 1 Definir a política de alarme e a gravidade do alarme
- Defina as configurações de notificação de alarme. Se você ativar Alarm Notification, defina o período de validade, o objeto de notificação e a condição de gatilho.
- Clique em Create.