更新时间:2023-12-29 GMT+08:00

管理组件和主机监控

用户在日常使用中,可以在MRS管理所有组件(含角色实例)和主机的状态及指标信息:

  • 状态信息,包括运行、健康、配置及角色实例状态统计。
  • 指标信息,各组件的主要监控指标项。
  • 导出监控指标(MRS 3.x及之后版本暂不支持)。
  • MRS 3.x及之后版本操作方法请参考操作方法
  • 用户可以选择页面自动刷新间隔的设置,也可以单击马上刷新。
  • 组件管理支持三种参数值:
    • “每30秒刷新一次”:刷新间隔30秒。
    • “每60秒刷新一次”:刷新间隔60秒。
    • “停止”:停止刷新。

前提条件

已完成IAM用户同步(在集群详情页的“概览”页签,单击“IAM用户同步”右侧的“同步”进行IAM用户同步)。

操作方法

管理组件监控

MRS Manager操作,请参考管理服务监控操作。

  1. 在MRS集群详情页面,单击“组件管理”。

    • 服务操作状态描述如表1所示。
      表1 服务操作状态

      状态

      描述

      已启动

      服务已启动。

      已停止

      服务已停止。

      启动失败

      用户启动操作失败。

      停止失败

      用户停止操作失败。

      未知

      后台系统重启后,服务的初始状态。

    • 服务健康状态如表2所示。
      表2 服务健康状态

      状态

      描述

      良好

      该服务中所有角色实例正常运行。

      故障

      至少一个角色实例运行状态为“故障”或被依赖的服务状态不正常。

      未知

      该服务中所有角色实例状态为“未知”。

      正在恢复

      后台系统正在尝试自动启动服务。

      亚健康

      该服务所依赖的服务状态不正常,异常服务的相关接口无法被外部调用。

    • 服务配置状态如表3所示。
      表3 服务配置状态

      状态

      描述

      已同步

      系统中最新的配置信息已生效。

      配置超期

      参数修改后,最新的配置未生效。需重启相应服务生效最新配置信息。

      配置失败

      参数配置过程中出现通信或读写异常。尝试使用“同步配置”恢复。

      配置中

      参数配置进行中。

      未知

      无法获取当前配置状态。

  1. 单击列表中指定服务名称,查看服务状态及指标信息。
  2. 定制、查看监控图表。

    1. 在“图表”区域框中,单击“定制”自定义服务监控指标。
    2. 在“时间区间”选择查询时间,单击“查看”显示该时间段内的监控数据。

管理角色实例监控

针对MRS 3.x之前版本,请参考管理角色实例监控操作。

  1. 在MRS集群详情页面,单击“组件管理”,在组件列表中单击服务指定名称。

    图1 组件管理

  2. 单击“实例”,查看角色状态。

    图2 实例

    角色实例列表中包含实例信息的角色、主机名管理IP业务IP机架运行状态配置状态

    • 角色实例的运行状态如表4所示。
      表4 角色实例运行状态

      状态

      描述

      良好

      表示实例当前运行正常。

      故障

      表示实例当前无法正常工作。

      已退服

      表示实例处于退服状态。

      未启动

      表示实例已停止。

      未知

      表示实例的初始状态信息无法检测。

      正在启动

      表示实例正在执行启动过程。

      正在停止

      表示实例正在执行停止过程。

      正在恢复

      表示实例可能存在异常正在自动修复。

      正在退服

      表示实例正在执行退服过程。

      正在入服

      表示实例正在执行入服过程。

      启动失败

      表示实例启动操作失败。

      停止失败

      表示实例停止操作失败。

    • 角色实例的配置状态如表5所示。
      表5 角色实例配置状态

      状态

      描述

      已同步

      系统中最新的配置信息已生效。

      配置超期

      参数修改后,最新的配置未生效。需重启相应服务生效最新配置信息。

      配置失败

      参数配置过程中出现通信或读写异常。尝试使用“同步配置”恢复。

      配置中

      参数配置进行中。

      未知

      无法获取当前配置状态。

    默认以“角色”列按升序排列,单击角色、主机名、管理IP、业务IP、机架运行状态配置状态可修改排列方式。

    支持在“角色”筛选相同角色的全部实例。

    单击“高级搜索”,在角色搜索区域中设置搜索条件,单击“搜索”,查看指定的角色信息。单击“重置”清除输入的搜索条件。支持模糊搜索条件的部分字符。

  3. 单击列表中指定角色实例名称,查看角色实例状态及指标信息。
  4. 定制、查看监控图表。

    1. 在“图表”区域框中,单击“定制”自定义服务监控指标。
    2. 在“时间区间”选择查询时间,单击“查看”显示该时间段内的监控数据。

管理主机监控

针对MRS 3.x之前版本,请参考管理主机监控操作。

  1. 在MRS集群详情页面,单击“节点管理”并展开节点组信息,查看所有主机状态。

    主机列表中包括节点名称/资源IDIP状态规格云硬盘可用区等信息。

    • 主机操作状态如表6所示。
      表6 主机操作状态

      状态

      描述

      正常

      主机及主机上的服务角色正常运行。

      已隔离

      主机被用户隔离,主机上的服务角色停止运行。

    • 主机健康状态描述如表7所示。
      表7 主机健康状态

      状态

      描述

      良好

      主机心跳检测正常。

      故障

      主机心跳超时未上报。

      未知

      执行添加操作时,主机的初始状态。

    默认以“节点名称”列按升序排列,单击参数指标后的可修改排列方式。

  2. 单击列表中指定的节点名称,查看单个节点状态及指标。