更新时间:2024-11-12 GMT+08:00

查看MRS集群节点运行状态

MRS集群运行过程中,用户可以在管理控制台或者集群Manager界面中实时查看集群内各节点运行状态,及时识别资源异常问题。

前提条件

  • 如果通过MRS管理控制台操作,需要已完成IAM用户同步(在集群详情页的“概览”页签,单击“IAM用户同步”右侧的“同步”进行IAM用户同步)
  • 如果通过Manager界面操作,需要已登录MRS集群Manager界面,详情请参考访问MRS集群Manager

通过管理控制台查看节点状态

  1. 登录MRS管理控制台。
  2. 选择“现有集群”,选中一个运行中的集群并单击集群名称,进入集群信息页面。
  3. 在集群详情页,单击“节点管理”。
  4. 展开节点组名称,可查看节点基本信息、节点状态、CPU使用率、内存使用率、磁盘使用率等信息。

    在主机列表单击指定的主机名称,可查看更详细的节点信息。

    表1 MRS集群节点信息

    参数

    参数说明

    节点组名称

    集群节点组名称。

    节点类型

    节点组对应的节点类型,可参考MRS集群节点类型说明

    单击节点组名称前方的,显示该节点组包含的节点,单击节点名称,使用创建集群时配置的密码或者密钥对远程登录弹性云服务器。节点参数说明请参见查看MRS集群组件监控指标

    节点数

    对应节点组中包含的节点数量。

    付费类型

    显示购买集群时的付费类型,包含“按需计费”和“包年/包月”。

通过Manager页面查看节点状态(MRS 3.x及之后版本)

  1. 登录FusionInsight Manager。
  2. 单击主机,查看主机列表信息。

    主机列表展示了集群中所有主机及主机基本信息,并支持对主机进行相关运维操作以及设置条件筛选和搜索主机;还可单击“导出全部”,在“保存类型”选择“TXT”或“CSV”,单击“确定”导出所有主机的信息。系统默认为“主机视图”,单击“角色视图”切换视图类型,也可单击编辑按钮自定义各视图展示的内容。

    表2 主机视图类型说明

    视图类型

    说明

    主机视图

    主要显示每个主机的IP地址信息、机架规划信息、运行状态以及硬件资源等使用情况。

    角色视图

    主要显示各主机上当前已部署的角色。如果该角色支持主备模式,则角色名称显示为加粗。

    表3 主机运行状态说明

    状态

    说明

    良好

    表示主机当前状态正常。

    故障

    表示主机当前无法正常工作。

    未知

    表示主机的初始状态信息无法检测。

    已隔离

    表示主机处于隔离的状态。

    已停机

    表示主机处于停机的状态。

  3. 在主机列表单击指定的主机名称,查看主机概览信息。

    在主机详情页面,主要包含基本信息区、磁盘状态区、实例列表区和监控图表等。
    表4 主机详情

    展示项

    说明

    基本信息区

    主机详情页面的基本信息包含该主机的各个关键信息,例如管理IP地址、业务IP地址、主机类型、机架、防火墙、CPU核数、操作系统等信息。

    磁盘状态区

    磁盘状态区包含了该主机所有为集群配置的磁盘分区,并显示每个磁盘分区的使用情况。

    实例列表区

    实例列表区显示了该主机所有安装的角色实例,并显示每个角色实例的状态,单击角色实例名称后的日志文件,可在线查看该实例对应日志文件内容。

    告警和事件的历史记录

    告警和事件的历史记录区显示了当前主机上报的关键告警与事件记录,系统最多可显示20条历史记录。

    图表

    主机详情页面的右侧展示图表区,包含该主机的各个关键监控指标报表。

    用户可以单击右上角的“ > 定制”,自定义在图表区展示的监控报表。选择时间区间后,单击“ > 导出”,可以导出指定时间区间内的详细监控指标数据。

    单击监控指标标题后的可以打开监控指标的解释说明。

  4. 查看主机图表,进程和资源信息。

    单击“图表”,“进程”和“资源”页签,可直接查看该主机的全量监控图表信息。
    • 图表页面可直接查看该主机的全量监控图表信息
    • 进程页面显示了当前主机上已部署服务实例的角色进程信息,例如进程状态、PID、进程运行时间等,并可直接在线查看各进程的日志文件内容。
    • 主机资源页面显示了当前主机上已部署服务实例的详细资源使用情况,包括CPU,内存,磁盘和端口情况。

通过Manager页面查看节点状态(MRS 2.x及之前版本)

  1. 登录MRS Manager。
  2. 单击“主机管理”,看所有主机状态。

    主机操作状态和健康状态分别如下表所示。
    表5 主机操作状态

    状态

    描述

    正常

    主机及主机上的服务角色正常运行。

    已隔离

    主机被用户隔离,主机上的服务角色停止运行。

    表6 主机健康状态

    状态

    描述

    良好

    主机心跳检测正常。

    故障

    主机心跳超时未上报。

    未知

    执行添加操作时,主机的初始状态。

  3. 单击列表中指定的主机名称,查看单个主机状态及指标。
  4. 定制、导出监控图表。

    1. 在“图表”区域框中,单击“定制”自定义服务监控指标。
    2. 在“时间区间”选择查询时间,单击“查看”显示该时间段内的监控数据。
    3. 单击“导出”,导出当前查看的指标数据。