Este conteúdo foi traduzido por máquina para sua conveniência e a Huawei Cloud não pode garantir que o conteúdo foi traduzido com precisão. Para exibir o conteúdo original, use o link no canto superior direito para mudar para a página em inglês.

Central de ajuda/ Distributed Message Service for Kafka/ Primeiros passos/ Passo 5: configurar regras de alarme

Atualizado em 2024-01-30 GMT+08:00

Ver PDF

Passo 5: configurar regras de alarme

Esta seção descreve as regras de alarme de algumas métricas e como configurá-las. Em serviços reais, é recomendável configurar regras de alarme para métricas com base nas seguintes políticas de alarme.

Approach Upper Limit na tabela a seguir indica se o desempenho do recurso atual está próximo do limite superior. Se o desempenho estiver próximo do limite superior, o desempenho suportado pelo recurso atual é o limite de alarme definido na política de alarmes. Se o desempenho continuar a aumentar, os serviços podem se tornar anormais.

**Tabela 1** Métricas de instância do Kafka para configurar regras de alarme para
ID da métrica	Métrica	Política de alarme	Descrição	Sugestão de tratamento
broker_disk_usage	Disk Capacity Usage	Limite de alarme: valor original > 80% Número de períodos consecutivos: 1 Gravidade do alarme: crítica	Uso do disco da VM do Kafka	Modifique o espaço de armazenamento da instância. Para obter detalhes, consulte Modificação de especificações de instância.
broker_cpu_core_load	Average Load per CPU Core	Limite de alarme: valor original > 2 Número de períodos consecutivos: 3 Gravidade do alarme: grave	Carga média de cada núcleo de CPU da VM de Kafka.	Verifique se a métrica está se aproximando ou excedendo o limite de alarme há muito tempo. Se sim, modifique a largura de banda ou o número de brokers da instância. Para obter detalhes, consulte Modificação de especificações de instância.
broker_memory_usage	Memory Usage	Limite de alarme: valor original > 90% Número de períodos consecutivos: 3 Gravidade do alarme: crítica	Uso de memória da VM de Kafka.	Modifique a largura de banda ou o número de brokers da instância. Para obter detalhes, consulte Modificação de especificações de instância.
current_partitions	Partitions	Limite de alarme: valor original > 90% do número máximo permitido de partições. O limite de partição varia dependendo das especificações da instância. Para obter detalhes, consulte Especificações. Número de períodos consecutivos: 1 Gravidade do alarme: grave	Número de partições usadas na instância.	Se novos tópicos forem necessários, modifique a largura de banda ou o número de brokers da instância ou divida o serviço em várias instâncias. Para obter detalhes sobre como modificar a largura de banda da instância ou o número de brokers, consulte Modificação das especificações da instância.
broker_cpu_usage	CPU Usage	Limite de alarme: valor original > 90% Número de períodos consecutivos: 3 Gravidade do alarme: grave	Uso da CPU da VM de Kafka.	Verifique se a métrica está se aproximando ou excedendo o limite de alarme há muito tempo. Se sim, modifique a largura de banda ou o número de brokers da instância. Para obter detalhes, consulte Modificação de especificações de instância.
group_msgs	Accumulated Messages	Limite de alarme: valor original > 90% do limite superior. O limite superior é personalizado. Número de períodos consecutivos: 1 Gravidade do alarme: grave	Número total de mensagens acumuladas em todos os grupos de consumidores da instância	Exclua grupos de consumidores ociosos, se houver. Você também pode acelerar a recuperação de mensagens, por exemplo, aumentando o número de consumidores.
topic_messages_remained	Topic Available Messages	Limite de alarme: valor original > 90% do limite superior. O limite superior é personalizado. Número de períodos consecutivos: 1 Gravidade do alarme: grave	Número de mensagens restantes que podem ser recuperadas do tópico especificado no grupo de consumidores.	Verifique se a lógica do código do consumidor está correta, por exemplo, verificando se o consumidor deixa de consumir mensagens devido a uma exceção. Você também pode acelerar a recuperação de mensagens, por exemplo, adicionando consumidores de tópicos. Certifique-se de que o número de partições seja maior ou igual ao número de consumidores.

Procedimento

Efetue logon no console do Kafka e selecione a região onde a instância do Kafka está localizada. A lista de instâncias do Kafka é exibida.
Exiba as métricas da instância usando um dos seguintes métodos:
- Clique em View Metric ao lado do nome da instância do Kafka para ir para a página de monitoramento de instâncias do console do Cloud Eye.
- Clique na instância de Kafka desejada para visualizar seus detalhes. No painel de navegação, escolha Monitoring.
Passe o ponteiro do mouse sobre uma métrica e clique em para criar uma regra de alarme para a métrica.
Especifique os detalhes do alarme.

Para obter mais informações sobre como criar regras de alarme, consulte Criação de uma regra de alarme.
1. Defina o nome e a descrição do alarme.
2. Especifique a política de alarme e a Gravidade do alarme.
  Conforme mostrado na figura a seguir, se o uso da capacidade original do disco exceder 85% por três períodos consecutivos, um alarme será gerado. Se o alarme não for tratado a tempo, é enviada uma notificação de alarme.
  
  Figura 1 Definir a política de alarme e a gravidade do alarme
3. Defina as configurações de notificação de alarme. Se você ativar Alarm Notification, defina o período de validade, o objeto de notificação e a condição de gatilho.
4. Clique em Create.