Este conteúdo foi traduzido por máquina para sua conveniência e a Huawei Cloud não pode garantir que o conteúdo foi traduzido com precisão. Para exibir o conteúdo original, use o link no canto superior direito para mudar para a página em inglês.
Computação
Elastic Cloud Server
Bare Metal Server
Auto Scaling
Image Management Service
Dedicated Host
FunctionGraph
Cloud Phone Host
Huawei Cloud EulerOS
Redes
Virtual Private Cloud
Elastic IP
Elastic Load Balance
NAT Gateway
Direct Connect
Virtual Private Network
VPC Endpoint
Cloud Connect
Enterprise Router
Enterprise Switch
Global Accelerator
Gerenciamento e governança
Cloud Eye
Identity and Access Management
Cloud Trace Service
Resource Formation Service
Tag Management Service
Log Tank Service
Config
Resource Access Manager
Simple Message Notification
Application Performance Management
Application Operations Management
Organizations
Optimization Advisor
Cloud Operations Center
Resource Governance Center
Migração
Server Migration Service
Object Storage Migration Service
Cloud Data Migration
Migration Center
Cloud Ecosystem
KooGallery
Partner Center
User Support
My Account
Billing Center
Cost Center
Resource Center
Enterprise Management
Service Tickets
HUAWEI CLOUD (International) FAQs
ICP Filing
Support Plans
My Credentials
Customer Operation Capabilities
Partner Support Plans
Professional Services
Análises
MapReduce Service
Data Lake Insight
CloudTable Service
Cloud Search Service
Data Lake Visualization
Data Ingestion Service
GaussDB(DWS)
DataArts Studio
IoT
IoT Device Access
Outros
Product Pricing Details
System Permissions
Console Quick Start
Common FAQs
Instructions for Associating with a HUAWEI CLOUD Partner
Message Center
Segurança e conformidade
Security Technologies and Applications
Web Application Firewall
Host Security Service
Cloud Firewall
SecMaster
Anti-DDoS Service
Data Encryption Workshop
Database Security Service
Cloud Bastion Host
Data Security Center
Cloud Certificate Manager
Situation Awareness
Managed Threat Detection
Blockchain
Blockchain Service
Serviços de mídia
Media Processing Center
Video On Demand
Live
SparkRTC
Armazenamento
Object Storage Service
Elastic Volume Service
Cloud Backup and Recovery
Cloud Server Backup Service
Storage Disaster Recovery Service
Scalable File Service
Volume Backup Service
Data Express Service
Dedicated Distributed Storage Service
Containers
Cloud Container Engine
SoftWare Repository for Container
Application Service Mesh
Ubiquitous Cloud Native Service
Cloud Container Instance
Bancos de dados
Relational Database Service
Document Database Service
Data Admin Service
Data Replication Service
GeminiDB
GaussDB
Distributed Database Middleware
Database and Application Migration UGO
TaurusDB
Middleware
Distributed Cache Service
API Gateway
Distributed Message Service for Kafka
Distributed Message Service for RabbitMQ
Distributed Message Service for RocketMQ
Cloud Service Engine
EventGrid
Dedicated Cloud
Dedicated Computing Cluster
Aplicações de negócios
ROMA Connect
Message & SMS
Domain Name Service
Edge Data Center Management
Meeting
AI
Face Recognition Service
Graph Engine Service
Content Moderation
Image Recognition
Data Lake Factory
Optical Character Recognition
ModelArts
ImageSearch
Conversational Bot Service
Speech Interaction Service
Huawei HiLens
Developer Tools
SDK Developer Guide
API Request Signing Guide
Terraform
Koo Command Line Interface
Distribuição de conteúdo e computação de borda
Content Delivery Network
Intelligent EdgeFabric
CloudPond
Soluções
SAP Cloud
High Performance Computing
Serviços para desenvolvedore
ServiceStage
CodeArts
CodeArts PerfTest
CodeArts Req
CodeArts Pipeline
CodeArts Build
CodeArts Deploy
CodeArts Artifact
CodeArts TestPlan
CodeArts Check
Cloud Application Engine
MacroVerse aPaaS
KooPhone
KooDrive
Central de ajuda/ Distributed Cache Service/ Guia de usuário/ Monitoramento/ Configurando Regras de Alarme para Métricas Críticas

Configurando Regras de Alarme para Métricas Críticas

Atualizado em 2025-01-23 GMT+08:00

Esta seção descreve as regras de alarme de algumas métricas e como configurar as regras. Em cenários reais, configure regras de alarme para métricas consultando as seguintes políticas de alarme.

Políticas de alarme para instâncias do DCS Redis

Tabela 1 Métricas de instância do DCS Redis para configurar regras de alarme para

Métrica

Intervalo de valores

Política de alarme

Aproximação do limite superior

Sugestão de manuseio

Uso da CPU

0–100%

Limite do alarme: > 70%

Número de períodos consecutivos: 2

Gravidade de alarme: Importante

Não

Considere a expansão da capacidade com base na análise do serviço.

A capacidade da CPU de uma instância de nó único ou principal/em espera não pode ser expandida. Se você precisar de uma capacidade maior, use uma instância de cluster.

Essa métrica está disponível somente para instâncias de cluster de proxy, de nó único, principal/em espera. Para instâncias do Cluster Redis, essa métrica está disponível somente no nível do Servidor Redis. Você pode exibir a métrica na página de guia Redis Server na página Performance Monitoring da instância.

Uso médio da CPU

0–100%

Limite do alarme: > 70%

Número de períodos consecutivos: 2

Gravidade de alarme: Importante

Não

Considere a expansão da capacidade com base na análise do serviço.

A capacidade da CPU de uma instância de nó único ou principal/em espera não pode ser expandida. Se você precisar de uma capacidade maior, use uma instância de cluster.

Essa métrica está disponível apenas para instâncias de cluster de proxy, de nó único, principal/em espera e de cluster. Para instâncias do Cluster Redis, essa métrica está disponível somente no nível do Servidor Redis. Você pode exibir a métrica na página de guia Redis Server na página Performance Monitoring da instância.

Uso da memória

0–100%

Limite do alarme: > 70%

Número de períodos consecutivos: 2

Gravidade de alarme: Crítico

Não

Expanda a capacidade da instância.

Clientes conectados

0–10.000

Limite do alarme: > 8000

Número de períodos consecutivos: 2

Gravidade de alarme: Importante

Não

Otimize o pool de conexões no código de serviço para evitar que o número de conexões exceda o limite máximo.

Configure essa política de alarme no nível da instância para instâncias de nó único e principal/em espera. Para instâncias de cluster, configure esta política de alarme no nível do Servidor Redis e Proxy.

Para instâncias de nó único e principal/em espera, o número máximo de conexões permitidas é 10.000. Você pode ajustar o limite com base nos requisitos de serviço.

Novas Conexões

(Contagem/min)

≥ 0

Limite do alarme: > 10.000

Número de períodos consecutivos: 2

Severidade do alarme: menor

-

Verifique se a connect é usada e se a conexão do cliente é anormal. Use conexões persistentes ("pconnect" na terminologia do Redis) para garantir o desempenho.

Configure essa política de alarme no nível da instância para instâncias de nó único e principal/em espera. Para instâncias de cluster, configure esta política de alarme no nível do Servidor Redis e Proxy.

Fluxo de entrada

≥ 0

Limite do alarme: > 80% da largura de banda assegurada

Número de períodos consecutivos: 2

Gravidade de alarme: Importante

Sim

Considere a expansão da capacidade com base na análise de serviço e no limite de largura de banda.

Configure esse alarme somente para instâncias do DCS Redis 3.0 de nó único e principal/em espera e defina o limite de alarme para 80% da largura de banda assegurada das instâncias do DCS Redis 3.0.

Fluxo de saída

≥ 0

Limite do alarme: > 80% da largura de banda assegurada

Número de períodos consecutivos: 2

Gravidade de alarme: Importante

Sim

Considere a expansão da capacidade com base na análise de serviço e no limite de largura de banda.

Configure esse alarme somente para instâncias do DCS Redis 3.0 de nó único e principal/em espera e defina o limite de alarme para 80% da largura de banda assegurada das instâncias do DCS Redis 3.0.

Políticas de alarme para instâncias do Memcached DCS

Tabela 2 Métricas de instância do Memcached DCS para configurar regras de alarme para

Métrica

Intervalo de valores

Política de alarme

Aproximação do limite superior

Sugestão de manipulação

Uso da CPU

0–100%

Limite do alarme: > 70%

Número de períodos consecutivos: 2

Gravidade de alarme: Importante

Não

Verifique o serviço para aumento de tráfego.

A capacidade da CPU de uma instância de nó único ou principal/em espera não pode ser expandida. Analise o serviço e considere dividir o serviço ou combinar várias instâncias em um cluster na extremidade do cliente.

Uso da memória

0–100%

Limite do alarme: > 65%

Número de períodos consecutivos: 2

Severidade do alarme: menor

Não

Considere expandir a capacidade da instância.

Clientes conectados

0–10.000

Limite do alarme: > 8000

Número de períodos consecutivos: 2

Gravidade de alarme: Importante

Não

Otimize o pool de conexões no código de serviço para evitar que o número de conexões exceda o limite máximo.

Novas conexões

≥ 0

Limite do alarme: > 10.000

Número de períodos consecutivos: 2

Gravidade de alarme: Secundária

-

Verifique se a connect é usada e se a conexão do cliente é anormal. Use conexões persistentes ("pconnect" na terminologia do Redis) para garantir o desempenho.

Fluxo de entrada

≥ 0

Limite do alarme: > 80% da largura de banda assegurada

Número de períodos consecutivos: 2

Gravidade de alarme: Importante

Sim

Considere a expansão da capacidade com base na análise de serviço e no limite de largura de banda.

Para obter detalhes sobre os limites de largura de banda de diferentes especificações de instância, consulte Especificações da instância do DCS.

Fluxo de saída

≥ 0

Limite do alarme: > 80% da largura de banda assegurada

Número de períodos consecutivos: 2

Gravidade de alarme: Importante

Sim

Considere a expansão da capacidade com base na análise de serviço e no limite de largura de banda.

Para obter detalhes sobre os limites de largura de banda de diferentes especificações de instância, consulte Especificações da instância do DCS.

Falhas de autenticação

≥ 0

Limite do alarme: > 0

Número de períodos consecutivos: 1

Gravidade de alarme: Crítico

-

Verifique se a senha foi inserida corretamente.

Políticas de alarme para nós do servidor Redis de instâncias do Redis DCS de cluster

Tabela 3 Métricas do servidor Redis para configurar políticas de alarme para

Métrica

Intervalo de valores

Política de alarme

Aproximação do limite superior

Sugestão de manipulação

Uso da CPU

0–100%

Limite do alarme: > 70%

Número de períodos consecutivos: 2

Gravidade de alarme: Importante

Não

Verifique o serviço para aumento de tráfego.

Verifique se o uso da CPU é distribuído uniformemente para os nós do Servidor Redis. Se o uso da CPU for alto em vários nós, considere a expansão da capacidade. Expandir a capacidade de uma instância de cluster dimensionará os nós para compartilhar a pressão da CPU.

Se o uso da CPU for alto em um único nó, verifique se as teclas de atalho existem. Se sim, otimize o código de serviço para eliminar teclas de atalho.

Uso médio da CPU

0–100%

Limite do alarme: > 70%

Número de períodos consecutivos: 2

Gravidade de alarme: Importante

Não

Considere a expansão da capacidade com base na análise do serviço.

A capacidade da CPU de uma instância de nó único ou principal/em espera não pode ser expandida. Se você precisar de uma capacidade maior, use uma instância de cluster.

Essa métrica está disponível apenas para instâncias de cluster de proxy, de nó único, principal/em espera e de cluster. Para instâncias do Cluster Redis, essa métrica está disponível somente no nível do Servidor Redis. Você pode exibir a métrica na página de guia Redis Server na página Performance Monitoring da instância.

Uso da memória

0–100%

Limite do alarme: > 70%

Número de períodos consecutivos: 2

Gravidade de alarme: Importante

Não

Verifique o serviço para aumento de tráfego.

Verifique se o uso da memória é distribuído uniformemente para os nós do Servidor Redis. Se o uso de memória for alto em vários nós, considere a expansão da capacidade. Se o uso de memória for alto em um único nó, verifique se existem chaves grandes. Em caso afirmativo, otimize o código de serviço para eliminar chaves grandes.

Clientes conectados

0–10.000

Limite do alarme: > 8000

Número de períodos consecutivos: 2

Gravidade de alarme: Importante

Não

Verifique se o número de conexões está dentro do intervalo apropriado. Se sim, ajuste o limiar de alarme.

Novas Conexões

≥ 0

Limite do alarme: > 10.000

Número de períodos consecutivos: 2

Severidade do alarme: menor

-

Verifique se a connect é usada. Para garantir o desempenho, use conexões persistentes ("pconnect" na terminologia do Redis).

Logs de consulta lentos

0–1

Limite do alarme: > 0

Número de períodos consecutivos: 1

Gravidade de alarme: Importante

-

Use a função de consulta lenta no console para analisar comandos lentos.

Uso de largura de banda

0–200%

Limite do alarme: > 90%

Número de períodos consecutivos: 2

Gravidade de alarme: Importante

Sim

Verifique se o aumento do uso de largura de banda vem de serviços de leitura ou serviços de gravação com base no fluxo de entrada e saída.

Se o uso de largura de banda de um único nó for alto, verifique se existem chaves grandes.

Mesmo que o uso da largura de banda exceda 100%, o controle de fluxo pode não necessariamente ser executado. O controle de fluxo real está sujeito à métrica Flow Control Times.

Mesmo que o uso da largura de banda esteja abaixo de 100%, o controle de fluxo pode ser realizado. O uso da largura de banda em tempo real é relatado uma vez em cada período de relatório. A métrica de tempos de controle de fluxo é relatada a cada segundo. Durante um período de relatório, o tráfego pode aumentar em segundos e, em seguida, voltar a cair. No momento em que o uso da largura de banda é relatado, ele foi restaurado para o nível normal.

Tempos de controle de fluxo

≥ 0

Limite do alarme: > 0

Número de períodos consecutivos: 1

Gravidade de alarme: Crítico

Sim

Considere a expansão da capacidade com base nos limites de especificação, fluxo de entrada e fluxo de saída.

NOTA:

Essa métrica é suportada apenas pelo Redis 4.0 e 5.0 e não pelo Redis 3.0.

Políticas de alarme para nós proxy de instâncias de Redis DCS de cluster

Tabela 4 Métricas de proxy para configurar políticas de alarme para

Métrica

Intervalo de valores

Política de alarme

Aproximação do limite superior

Sugestão de manipulação

Uso da CPU

0–100%

Limite do alarme: > 70%

Número de períodos consecutivos: 2

Gravidade de alarme: Crítico

Sim

Considere a expansão de capacidade, que adicionará Proxies.

Uso da memória

0–100%

Limite do alarme: > 70%

Número de períodos consecutivos: 2

Gravidade de alarme: Crítico

Sim

Considere a expansão de capacidade, que adicionará Proxies.

Clientes conectados

0–30.000

Limite do alarme: > 20.000

Número de períodos consecutivos: 2

Severidade do alarme: Importante

Não

Otimize o pool de conexões no código de serviço para evitar que o número de conexões exceda o limite máximo.

Configurando uma regra de alarme para um grupo de recursos

O Cloud Eye permite que você adicione instâncias DCS, nós do servidor Redis e nós proxy a grupos de recursos e gerencie instâncias e regras de alarme por grupo para simplificar o O&M. Para obter detalhes, consulte Criando um grupo de recursos.

  1. Criar um grupo de recursos.

    1. Faça login no console do Cloud Eye. No painel de navegação, escolha Resource Groups and then click Create Resource Group no canto superior direito.
    2. Insira um nome de grupo e adicione nós do Servidor Redis ao grupo de recursos.

      Você pode adicionar nós do Servidor Redis de instâncias diferentes ao mesmo grupo de recursos.

      Figura 1 Criando um grupo de recursos
    3. Clique em Create.

  2. No painel de navegação do console do Cloud Eye, escolha Alarm Management > Alarm Rules e clique em Create Alarm Rule para definir informações de alarme para o grupo de recursos.

    Crie uma regra de alarme de uso da CPU para todos os nós do Servidor Redis no grupo de recursos, conforme mostrado na figura a seguir.

    Figura 2 Criando uma regra de alarme para um grupo de recursos

  3. Clique em Create.

Configurando uma regra de alarme para um recurso específico

No exemplo a seguir, uma regra de alarme é definida para a métrica Slow Query Logs (is_slow_log_exist).

  1. Efetue login no console de DCS.
  2. Clique em no canto superior esquerdo do console de gerenciamento e selecione uma região.

    Selecione a mesma região que o serviço do aplicativo.

  3. No painel de navegação, escolha Cache Manager.
  4. Na linha que contém a instância do DCS cujas métricas você deseja exibir, clique em View Metric na coluna Operation.

    Figura 3 Exibição de métricas de instância

  5. Na página exibida, localize a métrica Slow Query Logs. Passe o mouse sobre a métrica e clique em para criar uma regra de alarme para a métrica.

    A página Create Alarm Rule é exibida.

  6. Especifique as informações do alarme.

    1. Defina o nome e a descrição do alarme.
    2. Especifique a política de alarme e a severidade do alarme.
      Por exemplo, a política de alarme mostrada em Figura 4 indica que um alarme será disparado se houver consultas lentas na instância por dois períodos consecutivos. Se nenhuma ação for realizada, o alarme será acionado uma vez por dia, até que o valor dessa métrica retorne a 0.
      Figura 4 Configurando o conteúdo do alarme
    3. Defina as configurações de notificação de alarme. Se você ativar Alarm Notification, defina o período de validade, o objeto de notificação e a condição de gatilho.
    4. Clique em Create.

      Para obter mais informações sobre como criar regras de alarme, consulte Criando uma regra de alarme.

Usamos cookies para aprimorar nosso site e sua experiência. Ao continuar a navegar em nosso site, você aceita nossa política de cookies. Saiba mais

Feedback

Feedback

Feedback

0/500

Conteúdo selecionado

Envie o conteúdo selecionado com o feedback