更新时间:2024-04-15 GMT+08:00
分享

集群监控概述

为集群开启监控才能确保您的集群处于实时守护状态。开启过程中,系统会自动为集群安装kube-prometheus-stack插件(简称普罗)和log-agent插件。kube-prometheus-stack通过使用Prometheus-operator和Prometheus,提供简单易用的端到端Kubernetes集群监控能力。log-agent是基于开源fluent-bit和opentelemetry构建的云原生日志采集插件,支持基于CRD的日志采集策略,可以根据您配置的策略规则,对集群中的容器标准输出日志、容器文件日志、节点日志及K8s事件日志进行采集与转发。

关于插件的详细说明,请参考kube-prometheus-stack插件云原生日志采集插件章节。

目前容器智能分析支持监控华为云集群、附着集群、本地集群、多云集群。在开启监控时,各个集群的参数配置存在差异,因此,本小节将分别介绍这五种集群的开启操作。

插件状态说明

kube-prometheus-stack和log-agent插件的状态说明如表1所示。部分状态将影响集群进行监控开启、监控配置修改和监控关闭操作,详见后续章节的约束与限制部分。

表1 插件状态说明

状态

说明

插件未安装

插件未安装

运行中

插件全部实例状态都在运行中,插件正常使用

安装中

插件正在安装中

升级中

插件正在更新中

回滚中

插件正在回滚中

回滚失败

插件回滚失败,可重试回滚或卸载后重新安装

删除中

插件正在删除中

部分就绪

插件下只有部分实例状态为运行中,插件部分功能可用

不可用

插件状态异常,插件不可使用。可单击插件名称查看实例异常事件

安装失败

插件安装失败,需要卸载后重新安装

升级失败

插件升级失败,可重试升级或卸载后重新安装

删除失败

插件删除失败,可重试卸载

未知

插件处于未知状态,需要卸载后重新安装

相关文档