更新时间:2024-10-24 GMT+08:00

执行MRS集群健康检查

集群健康检查包含检查对象的“健康状态”、相关的告警和自定义的监控指标等三项检查项,但检查结果不能等同于界面上显示的“健康状态”。检查范围包含Manager、服务级别和主机级别的健康检查:

  • Manager关注集群统一管理平台是否提供正常管理功能。
  • 服务级别关注组件是否能够提供正常的服务。
  • 主机级别关注主机的一系列指标是否正常。

本章节指导用户在日常运维中完成集群健康检查的工作,以保证集群各项参数、配置以及监控没有异常、能够长时间稳定运行。

前提条件

  • 如果通过MRS管理控制台操作,需要已完成IAM用户同步(在集群详情页的“概览”页签,单击“IAM用户同步”右侧的“同步”进行IAM用户同步)
  • 如果通过Manager界面操作,需要已登录MRS集群Manager界面,详情请参考访问MRS集群Manager

在MRS管理控制台执行健康检查

  1. 登录MRS管理控制台。
  2. 选择“现有集群”,选中一个运行中的集群并单击集群名称,进入集群信息页面。
  3. 启动健康检查。

    在MRS管理控制台执行健康检查管理操作仅适用于MRS 1.9.2集群。

    • 手动执行所有服务的健康检查:

      选择“管理操作 > 启动集群健康检查”。

    • 手动执行单个服务的健康检查:

      单击“组件管理”,在服务列表中单击指定服务名称,选择“更多 > 启动服务健康检查”启动指定服务健康检查。

    • 手动执行主机健康检查:

      单击“节点管理”,展开节点组信息,勾选待检查主机前的复选框,选择“节点操作 > 启动主机健康检查”启动指定主机健康检查。

在Manager执行健康检查

MRS 3.x及之后版本:

  1. 登录FusionInsight Manager。
  2. 选择运维 > 健康检查

    默认显示所有已保存的检查报告,以列表形式展示,详情可参考表1

  3. 启动健康检查。

    • 直接启动健康检查:

      单击“启动检查”,根据界面提示单击“确定”启动健康检查。

    • 设置定期自动健康检查:

      单击“配置”,勾选“启用”,启用后根据运维需要选择检查周期为“每天”、“每周”或“每月”,单击“确定”保存配置。

MRS 2.x及之前版本

  1. 登录MRS Manager。
  2. 启动健康检查。

    • 直接启动健康检查:

      单击“服务管理”,选择“更多 > 启动服务健康检查”,启动服务健康检查。

    • 设置定期自动健康检查:
      1. 单击“系统设置”,单击“维护”下方的“健康检查”,单击“健康检查配置”。
      2. 配置“健康检查报告文件最大份数”,该值必须是整数,取值范围1~100。
      3. 单击“定期健康检查”的开关开启该功能,启用后根据运维需要选择检查周期为“每天”、“每周”或“每月”,单击“确定”保存配置。