Cluster
Para observar o uso de recursos e o status de integridade de todo o cluster, clique em Container Insight > Clusters. A página exibida fornece as informações de monitoramento de um único cluster, incluindo Integridade do recurso, Visão geral dos recursos, Estatísticas principais de consumo de recursos e Estatísticas de uso.
Caminho de navegação
- Efetue logon no console do CCE e clique no nome do cluster para acessar o console do cluster.
- Escolha Monitoring Center no painel de navegação e clique em Container Insight > Clusters.
Integridade do recurso
Se um complemento kube-prometheus-stack instalado em um cluster for implementado no modo Server, você poderá exibir o status de integridade do recurso do cluster.
A avaliação de integridade do recurso inclui várias dimensões, como pontuação de integridade, número de itens de risco a serem processados, nível de risco e proporção de itens de risco diagnosticados em nós principais, clusters, nós de trabalho, cargas de trabalho e dependências externas. Os dados anormais são exibidos em vermelho. Para obter mais resultados de diagnóstico, vá para a página da guia Diagnóstico de integridade.
Visão geral dos recursos
Resource Overview exibe a proporção de recursos anormais em nós, cargas de trabalho e pods e o número total de namespaces. Além disso, a proporção de exceção de componentes do plano de controle e nós principais, o QPS total do servidor da API e a taxa de erro de solicitação do servidor da API também estão incluídos.
Como o provedor de serviços da API do cluster, se o servidor da API no plano de controle for anormal, todo o cluster pode falhar ao ser acessado e as cargas de trabalho que dependem do servidor da API podem falhar ao ser executadas corretamente. Para ajudá-lo a identificar e corrigir problemas rapidamente, a visão geral dos recursos fornece o QPS total e as métricas de taxa de erro de solicitação do servidor da API.
Estatísticas principais de consumo de recursos
O CCE coleta estatísticas sobre nós, Implementações, StatefulSets e pods com 5 principais usos de CPU e memória, ajudando a identificar usuários com alto consumo de recursos. Para exibir todos os dados, vá para a página da guia Nodes, Workloads ou Pods.
Explicação das métricas de monitoramento
- CPU Usage
Uso da CPU da carga de trabalho = uso médio da CPU em cada pod da carga de trabalho
Uso de CPU do pod = os núcleos de CPU usados/a soma de todos os limites de CPU dos pods (se não especificado, todos os núcleos de CPU do nó são usados.)
- Memory Usage
Uso da memória da carga de trabalho = uso médio da memória em cada pod da carga de trabalho
Uso de memória do pod = a memória física usada/a soma de todos os limites de memória dos pods (se não for especificado, toda a memória do nó será usada.)
Estatísticas de uso
Por padrão, o uso de recursos de cada dimensão na última hora, nas últimas 8 horas e nas últimas 24 horas é coletado. Para exibir mais informações sobre monitoramento, clique em View All Metrics para acessar a página Dashboard. Para mais detalhes, consulte Painel.
Você pode passar o mouse sobre um gráfico para visualizar os dados de monitoramento de cada minuto.
- CPU
Estatísticas sobre o uso da CPU do cluster em um período especificado.
Figura 4 CPU
- Memory
Estatísticas sobre o uso de memória do cluster em um período especificado.
Figura 5 Memória
- Network
Tráfego de rede de contêineres, indicando a carga de rede do contêiner e a comunicação de rede entre contêineres.
Figura 6 Rede
- Network Packet Loss Rate
Relação entre o número de pacotes perdidos e o número total de pacotes transmitidos.
Figura 7 Taxa de perda de pacotes de rede
- PVC Storage Status
Estado de vinculação entre a PVC e o PV.
Figura 8 Status de armazenamento de PVC
- Pod Status Trend
Monitora o status do pod no cluster em tempo real.
Figura 9 Tendência de status do pod
- Trend of Total Pod Restarts
Número total de reinicializações do pod no cluster nos últimos 5 minutos.
Figura 10 Tendência de reinicializações totais do pod
- Node Status Trend
Monitora o status do nó no cluster em tempo real.
Figura 11 Tendência de status do nó