Este conteúdo foi traduzido por máquina para sua conveniência e a Huawei Cloud não pode garantir que o conteúdo foi traduzido com precisão. Para exibir o conteúdo original, use o link no canto superior direito para mudar para a página em inglês.
Computação
Elastic Cloud Server
Bare Metal Server
Auto Scaling
Image Management Service
Dedicated Host
FunctionGraph
Cloud Phone Host
Huawei Cloud EulerOS
Redes
Virtual Private Cloud
Elastic IP
Elastic Load Balance
NAT Gateway
Direct Connect
Virtual Private Network
VPC Endpoint
Cloud Connect
Enterprise Router
Enterprise Switch
Global Accelerator
Gerenciamento e governança
Cloud Eye
Identity and Access Management
Cloud Trace Service
Resource Formation Service
Tag Management Service
Log Tank Service
Config
Resource Access Manager
Simple Message Notification
Application Performance Management
Application Operations Management
Organizations
Optimization Advisor
Cloud Operations Center
Resource Governance Center
Migração
Server Migration Service
Object Storage Migration Service
Cloud Data Migration
Migration Center
Cloud Ecosystem
KooGallery
Partner Center
User Support
My Account
Billing Center
Cost Center
Resource Center
Enterprise Management
Service Tickets
HUAWEI CLOUD (International) FAQs
ICP Filing
Support Plans
My Credentials
Customer Operation Capabilities
Partner Support Plans
Professional Services
Análises
MapReduce Service
Data Lake Insight
CloudTable Service
Cloud Search Service
Data Lake Visualization
Data Ingestion Service
GaussDB(DWS)
DataArts Studio
IoT
IoT Device Access
Outros
Product Pricing Details
System Permissions
Console Quick Start
Common FAQs
Instructions for Associating with a HUAWEI CLOUD Partner
Message Center
Segurança e conformidade
Security Technologies and Applications
Web Application Firewall
Host Security Service
Cloud Firewall
SecMaster
Anti-DDoS Service
Data Encryption Workshop
Database Security Service
Cloud Bastion Host
Data Security Center
Cloud Certificate Manager
Situation Awareness
Managed Threat Detection
Blockchain
Blockchain Service
Serviços de mídia
Media Processing Center
Video On Demand
Live
SparkRTC
Armazenamento
Object Storage Service
Elastic Volume Service
Cloud Backup and Recovery
Cloud Server Backup Service
Storage Disaster Recovery Service
Scalable File Service
Volume Backup Service
Data Express Service
Dedicated Distributed Storage Service
Containers
Cloud Container Engine
SoftWare Repository for Container
Application Service Mesh
Ubiquitous Cloud Native Service
Cloud Container Instance
Bancos de dados
Relational Database Service
Document Database Service
Data Admin Service
Data Replication Service
GeminiDB
GaussDB
Distributed Database Middleware
Database and Application Migration UGO
TaurusDB
Middleware
Distributed Cache Service
API Gateway
Distributed Message Service for Kafka
Distributed Message Service for RabbitMQ
Distributed Message Service for RocketMQ
Cloud Service Engine
EventGrid
Dedicated Cloud
Dedicated Computing Cluster
Aplicações de negócios
ROMA Connect
Message & SMS
Domain Name Service
Edge Data Center Management
Meeting
AI
Face Recognition Service
Graph Engine Service
Content Moderation
Image Recognition
Data Lake Factory
Optical Character Recognition
ModelArts
ImageSearch
Conversational Bot Service
Speech Interaction Service
Huawei HiLens
Developer Tools
SDK Developer Guide
API Request Signing Guide
Terraform
Koo Command Line Interface
Distribuição de conteúdo e computação de borda
Content Delivery Network
Intelligent EdgeFabric
CloudPond
Soluções
SAP Cloud
High Performance Computing
Serviços para desenvolvedore
ServiceStage
CodeArts
CodeArts PerfTest
CodeArts Req
CodeArts Pipeline
CodeArts Build
CodeArts Deploy
CodeArts Artifact
CodeArts TestPlan
CodeArts Check
Cloud Application Engine
MacroVerse aPaaS
KooPhone
KooDrive
Central de ajuda/ GaussDB(DWS)/ Guia de gerenciamento/ Monitoramento e alarmes/ Alarmes/ Tratamento de alarmes/ DWS_2000000018 Queue Congestion in the Cluster Default Resource Pool

DWS_2000000018 Queue Congestion in the Cluster Default Resource Pool

Atualizado em 2024-08-19 GMT+08:00

Descrição

O GaussDB (DWS) usa o Pool de recursos para controlar recursos de memória, I/O e CPU, gerencia e aloca recursos com base em prioridades de tarefas e gerencia cargas de serviços do usuário. Quando os recursos são insuficientes, algumas instruções SQL precisam ficar na fila para esperar que outras instruções sejam executadas. Para obter detalhes, consulte Enfileiramento de CCN no gerenciamento de carga dinâmica.

GaussDB(DWS) verifica a fila no pool de recursos padrão default_pool a cada 5 minutos. Este alarme é gerado quando há instruções SQL que são enfileiradas por um longo tempo (20 minutos por padrão e configuráveis). Este alarme é apagado automaticamente quando o limite de alarme não for mais atingido.

Se as instruções SQL bloqueadas que podem disparar o alarme persistirem, o alarme é gerado novamente após 24 horas (configurável).

Atributos

ID do alarme

Gravidade do alarme

Apagar automaticamente

DWS_2000000018

Critical

Sim

Parâmetros

Parâmetro

Descrição

Source

Indica o nome do sistema para o qual o alarme é gerado e o tipo de alarme detalhado.

Cluster Name

ID do cluster para o qual o alarme é gerado

Location Information

ID e nome do cluster para o qual o alarme é gerado

Alarm Information

CloudService indica o serviço de nuvem para o qual o alarme é gerado, incluindo o nome do serviço, ID do recurso, hora do primeiro alarme e informações de alarme formatadas. Exemplo: CloudServiceDWS, resourceId=xxxx-xxxx-xxxx-xxxx, resourceIdName=test_dws, first_alarm_time:2023-01-11:19:02:09. O pool de recursos padrão do cluster test_dws está bloqueado nos últimos 20 minutos.

Time

Indica a hora em que o alarme foi gerado.

Status

Indica o status atual de um alarme.

Impacto no sistema

Quando o pool de recursos padrão é bloqueado, todas as consultas complexas (memória estimada maior ou igual a 32 MB) associadas ao pool de recursos padrão no cluster também podem ser bloqueadas. As consultas na fila são despertas somente quando as consultas em execução são concluídas.

Possíveis causas

  • O uso estimado da memória de consulta é muito grande. Como resultado, o uso estimado de memória acumulado excede o limite superior da memória disponível dinâmica, causando o enfileiramento de CCN.
  • A competição por recursos públicos, como CPU e I/O, deteriora o desempenho da execução de consultas.

Procedimento de manuseio

  1. Verifique se a fila é causada por memória estimada muito grande.

    Corrija a falha referindo-se a Enfileiramento de CCN no gerenciamento de carga dinâmica.

  2. Verifique se a memória disponível do cluster é normal.

    1. Efetue logon no console do GaussDB(DWS).
    2. Na página Alarms, selecione o cluster atual na lista suspensa de seleção de cluster no canto superior direito e visualize as informações de alarme do cluster nos últimos sete dias. Localize o nome do cluster que dispara o alarme com base nas informações de localização.

    3. Na página Clusters, localize a linha que contém o cluster para o qual o alarme é gerado e clique em Monitoring Panel na coluna Operation.

    4. Escolha Monitoring > Node Monitoring > Overview para exibir o uso de memória de cada nó no cluster atual. Se você quiser exibir as informações de monitoramento histórico sobre o uso de memória de um nó, clique em à direita para exibir o uso de memória nas últimas 1, 3, 12 ou 24 horas.

      Se o uso de memória do cluster for baixo (por exemplo, menor que 50%), o alarme poderá ser gerado porque o uso estimado de memória das consultas é muito grande. Nesse caso, execute a operação Analyze em tabelas relacionadas.

  3. Verifique a concorrência de outros recursos.

    1. Verifique o uso de CPU, I/O e rede do cluster consultando a seção 2.
    2. Se o banco de dados estiver totalmente carregado, consulte Top SQL em tempo real e elimine as instruções que ocupam um grande número de recursos.

  4. Verifique se muitas consultas são enviadas em um curto período de tempo.

    1. Execute a seguinte instrução SQL para consultar o status de execução da tarefa:
       1
       2
       3
       4
       5
       6
       7
       8
       9
      10
      11
      12
      SELECT 
         s.resource_pool AS rpname, s.node_group, 
         count(1) AS session_cnt, 
         SUM(CASE WHEN a.enqueue = 'waiting in global queue' THEN 1 ELSE 0 END) AS global_wait, 
         SUM(CASE WHEN s.lane= 'fast' AND a.state = 'active' AND (a.enqueue IS NULL OR a.enqueue = 'no waiting queue') THEN 1 ELSE 0 END) AS fast_run, 
         SUM(CASE WHEN s.lane= 'fast' AND a.enqueue = 'waiting in respool queue' THEN 1 ELSE 0 END) AS fast_wait, 
         SUM(CASE WHEN s.lane= 'slow' AND a.state = 'active' AND (a.enqueue IS NULL OR a.enqueue = 'no waiting queue') THEN 1 ELSE 0  END) AS slow_run, 
         SUM(CASE WHEN s.lane= 'slow' AND (a.enqueue = 'waiting in ccn queue' OR a.enqueue = 'waiting in respool queue') THEN 1 ELSE 0  END) AS slow_wait, 
         SUM(CASE WHEN (a.enqueue IS NULL OR a.enqueue = 'no waiting queue') AND a.state = 'active' THEN statement_mem ELSE 0 END) AS est_mem 
      FROM pgxc_session_wlmstat s,pgxc_stat_activity a 
      WHERE s.threadid=a.pid(+) AND s.attribute != 'Internal' 
      GROUP BY 1,2;
      
      A seguir, um exemplo do possível resultado da execução da instrução SQL:
      1
      2
      3
      4
      5
          rpname    |  node_group  | session_cnt | global_wait | fast_run | fast_wait | slow_run | slow_wait | est_mem 
      --------------+--------------+-------------+-------------+----------+-----------+----------+-----------+---------
       default_pool | installation |           6 |           0 |        0 |         0 |        0 |         0 |       0
       root         | installation |           1 |           0 |        0 |         0 |        0 |         0 |       0
      (2 rows)
      
    • No resultado da consulta, se o valor de slow_wait correspondente a default_pool não for 0, o cluster será totalmente carregado devido a muitos trabalhos. Como resultado, um alarme é gerado. Nesse caso, você pode localizar a linha que contém o cluster especificado no console, escolha Monitoring Panel na coluna Operation. Na página exibida, escolha Monitoring > Queries para consultar a tarefa com o maior tempo de execução e matar a tarefa.

    • Se o alarme for gerado com frequência, é aconselhável programar serviços fora do horário de pico ou criar novos pools de recursos para gerenciar os recursos do sistema de uma maneira mais refinada. Para obter detalhes, consulte Criação de um pool de recursos.

Liberação de alarme

Este alarme é automaticamente apagado quando o bloqueio do pool de recursos é aliviado.

Para exibir instruções SQL bloqueadas históricas, localize a linha que contém o cluster de destino no console, escolha Monitoring Panel na coluna Operation. Na página exibida, escolha Monitoring > History para consultar o tempo de execução de instruções SQL históricas.

Usamos cookies para aprimorar nosso site e sua experiência. Ao continuar a navegar em nosso site, você aceita nossa política de cookies. Saiba mais

Feedback

Feedback

Feedback

0/500

Conteúdo selecionado

Envie o conteúdo selecionado com o feedback