更新时间:2023-03-17 GMT+08:00
执行健康检查
操作场景
该任务指导用户在日常运维中完成集群进行健康检查的工作,以保证集群各项参数、配置以及监控没有异常、能够长时间稳定运行。
系统健康检查的范围包含Manager、服务级别和主机级别的健康检查:
- Manager关注集群统一管理平台是否提供管理功能。
- 服务级别关注组件是否能够提供正常的服务。
- 主机级别关注主机的一系列指标是否正常。
系统健康检查可以包含三方面检查项:各检查对象的“健康状态”、相关的告警和自定义的监控指标,检查结果并不能等同于界面上显示的“健康状态”。
操作步骤
父主题: 健康检查管理