Este conteúdo foi traduzido por máquina para sua conveniência e a Huawei Cloud não pode garantir que o conteúdo foi traduzido com precisão. Para exibir o conteúdo original, use o link no canto superior direito para mudar para a página em inglês.
Atualizado em 2024-01-30 GMT+08:00

Passo 5: configurar regras de alarme

Esta seção descreve as regras de alarme de algumas métricas e como configurá-las. Em serviços reais, é recomendável configurar regras de alarme para métricas com base nas seguintes políticas de alarme.

Approach Upper Limit na tabela a seguir indica se o desempenho do recurso atual está próximo do limite superior. Se o desempenho estiver próximo do limite superior, o desempenho suportado pelo recurso atual é o limite de alarme definido na política de alarmes. Se o desempenho continuar a aumentar, os serviços podem se tornar anormais.

Tabela 1 Métricas de instância do Kafka para configurar regras de alarme para

ID da métrica

Métrica

Política de alarme

Descrição

Sugestão de tratamento

broker_disk_usage

Disk Capacity Usage

Limite de alarme: valor original > 80%

Número de períodos consecutivos: 1

Gravidade do alarme: crítica

Uso do disco da VM do Kafka

Modifique o espaço de armazenamento da instância. Para obter detalhes, consulte Modificação de especificações de instância.

broker_cpu_core_load

Average Load per CPU Core

Limite de alarme: valor original > 2

Número de períodos consecutivos: 3

Gravidade do alarme: grave

Carga média de cada núcleo de CPU da VM de Kafka.

Verifique se a métrica está se aproximando ou excedendo o limite de alarme há muito tempo. Se sim, modifique a largura de banda ou o número de brokers da instância. Para obter detalhes, consulte Modificação de especificações de instância.

broker_memory_usage

Memory Usage

Limite de alarme: valor original > 90%

Número de períodos consecutivos: 3

Gravidade do alarme: crítica

Uso de memória da VM de Kafka.

Modifique a largura de banda ou o número de brokers da instância. Para obter detalhes, consulte Modificação de especificações de instância.

current_partitions

Partitions

Limite de alarme: valor original > 90% do número máximo permitido de partições. O limite de partição varia dependendo das especificações da instância. Para obter detalhes, consulte Especificações.

Número de períodos consecutivos: 1

Gravidade do alarme: grave

Número de partições usadas na instância.

Se novos tópicos forem necessários, modifique a largura de banda ou o número de brokers da instância ou divida o serviço em várias instâncias. Para obter detalhes sobre como modificar a largura de banda da instância ou o número de brokers, consulte Modificação das especificações da instância.

broker_cpu_usage

CPU Usage

Limite de alarme: valor original > 90%

Número de períodos consecutivos: 3

Gravidade do alarme: grave

Uso da CPU da VM de Kafka.

Verifique se a métrica está se aproximando ou excedendo o limite de alarme há muito tempo. Se sim, modifique a largura de banda ou o número de brokers da instância. Para obter detalhes, consulte Modificação de especificações de instância.

group_msgs

Accumulated Messages

Limite de alarme: valor original > 90% do limite superior. O limite superior é personalizado.

Número de períodos consecutivos: 1

Gravidade do alarme: grave

Número total de mensagens acumuladas em todos os grupos de consumidores da instância

Exclua grupos de consumidores ociosos, se houver. Você também pode acelerar a recuperação de mensagens, por exemplo, aumentando o número de consumidores.

topic_messages_remained

Topic Available Messages

Limite de alarme: valor original > 90% do limite superior. O limite superior é personalizado.

Número de períodos consecutivos: 1

Gravidade do alarme: grave

Número de mensagens restantes que podem ser recuperadas do tópico especificado no grupo de consumidores.

Verifique se a lógica do código do consumidor está correta, por exemplo, verificando se o consumidor deixa de consumir mensagens devido a uma exceção. Você também pode acelerar a recuperação de mensagens, por exemplo, adicionando consumidores de tópicos. Certifique-se de que o número de partições seja maior ou igual ao número de consumidores.

Procedimento

  1. Efetue logon no console do Kafka e selecione a região onde a instância do Kafka está localizada. A lista de instâncias do Kafka é exibida.
  2. Exiba as métricas da instância usando um dos seguintes métodos:

    • Clique em View Metric ao lado do nome da instância do Kafka para ir para a página de monitoramento de instâncias do console do Cloud Eye.
    • Clique na instância de Kafka desejada para visualizar seus detalhes. No painel de navegação, escolha Monitoring.

  3. Passe o ponteiro do mouse sobre uma métrica e clique em para criar uma regra de alarme para a métrica.
  4. Especifique os detalhes do alarme.

    Para obter mais informações sobre como criar regras de alarme, consulte Criação de uma regra de alarme.

    1. Defina o nome e a descrição do alarme.
    2. Especifique a política de alarme e a Gravidade do alarme.

      Conforme mostrado na figura a seguir, se o uso da capacidade original do disco exceder 85% por três períodos consecutivos, um alarme será gerado. Se o alarme não for tratado a tempo, é enviada uma notificação de alarme.

      Figura 1 Definir a política de alarme e a gravidade do alarme
    3. Defina as configurações de notificação de alarme. Se você ativar Alarm Notification, defina o período de validade, o objeto de notificação e a condição de gatilho.
    4. Clique em Create.