更新时间:2024-11-18 GMT+08:00
分享

查看MRS集群资源监控指标

MRS支持将集群中所有部署角色的节点,按管理节点、控制节点和数据节点进行分类,分别计算关键主机监控指标在每类节点上的变化趋势,并在报表中按用户自定义的周期显示分布曲线图。MRS集群指标监控采用周期性监控,历史监控平均周期约为5分钟。

用户可在MRS管理控制台或者Manager界面中查看集群整体的资源概况。

前提条件

  • 如果通过MRS管理控制台操作,需要已完成IAM用户同步(在集群详情页的“概览”页签,单击“IAM用户同步”右侧的“同步”进行IAM用户同步)
  • 如果通过Manager界面操作,需要已登录MRS集群Manager界面,详情请参考访问MRS集群Manager

通过管理控制台查看集群监控

  1. 登录MRS管理控制台。
  2. 选择“现有集群”,选中一个运行中的集群并单击集群名称,进入集群信息页面。
  3. “概览”页签单击“IAM用户同步”右侧的“单击同步”进行IAM用户同步。
  4. 用户同步完成后,单击“监控信息”页签,查看到集群的监控指标报表。
  5. 在时间区间选择需要查看监控数据的时间段。
  6. 自定义监控指标报表。

    1. 单击“定制”,勾选需要显示的监控指标。
    2. 单击“确定”保存并显示所选指标。

      单击“清除全部”可批量取消全部选中的指标项。

  7. 导出监控指标报表。

    1. 选择报表的时间范围。
    2. 单击“导出”,MRS将生成指定时间范围内、已勾选的集群监控指标报表文件,请选择一个位置保存,并妥善保管该文件。

      仅MRS 3.x之前版本支持导出监控指标报表。

通过Manager查看集群监控(MRS 3.x及之后版本)

  1. 登录集群Manager界面。
  2. 单击“主页”
  3. 在图表区的右上角,单击,在弹出菜单中选择“定制”

    监控时段以5分钟为单位,显示最近1小时的监控数据;从进入“实时监控”页面后,在监控图右侧以5分钟为单位显示实时监控数据。

  4. 在窗口左侧分类中,选择一项监控资源主体,然后勾选一个或多个监控指标。
  5. 单击“确定”即可查看对应的监控指标详情。
  6. 导出监控指标报表。

    • 导出全部监控数据
      1. 在“主页”选择所需要操作的集群的图表区的右上角,选择一个时间范围获取监控数据,例如“1周”

        默认为实时数据,无法导出。单击可以自定义监控数据时间范围。

      2. 在图表区的右上角,单击,在弹出菜单中选择“导出”
    • 导出指定监控项数据
      1. 在“主页”选择所需要操作的集群的图表区任意一个监控报表窗格的右上角,单击
      2. 选择一个时间范围获取监控数据,例如“1周”

        默认为实时数据,无法导出。单击可以自定义监控数据时间范围。

      3. 单击“导出”

      历史报表根据所自定义的时间长度不同,图表横轴中每个时间间隔也会不同,具体监控数据的规则如下:

      • 如果FusionInsight Manager存储所用的GaussDB所在分区的磁盘使用率超过80%时,会清理实时监控数据和周期为5分钟的监控数据。
      • 若为“租户资源”下的“存储资源(HDFS)”,0小时~300小时:每个间隔1小时,要求集群至少安装1小时以上,最多保留3个月监控数据。

      MRS 3.3.0之前版本集群:

      • 0~25小时:每个间隔5分钟,要求集群至少安装10分钟以上,最多保留15天监控数据。
      • 25小时~150小时:每个间隔30分钟,要求集群至少安装30分钟以上,最多保留3个月监控数据。
      • 150小时~300小时:每个间隔1小时,要求集群至少安装1小时以上,最多保留3个月监控数据。
      • 300小时~300天:每个间隔1天,要求集群至少安装1天以上,最多保留6个月监控数据。
      • 300天以上:每个间隔7天,要求集群安装7天以上,最多保留一年的监控数据。

      MRS 3.3.0及之后版本集群:

      • 0~21小时20分:每个间隔5分钟,要求集群至少安装10分钟以上,最多保留90天监控数据。
      • 21小时20分~128小时:每个间隔30分钟,要求集群至少安装30分钟以上,最多保留90天监控数据。
      • 128小时~256小时:每个间隔1小时,要求集群至少安装1小时以上,最多保留90天监控数据。
      • 256小时~256天及以上:每个间隔1天,要求集群至少安装1天以上,最多保留90天监控数据。

通过Manager查看集群监控(MRS 2.x及之前版本)

  1. 登录Manager页面,选择“系统概览”
  2. “时间区间”选择需要查看监控数据的时间段。可供选择的选项如下:

    实时、最近3小时、最近6小时、最近24小时、最近一周、最近一个月、最近三个月、最近六个月、自定义(选择自定义时,在时间范围内自行选择需要查看的时间)。

  3. 单击“查看”可以查看相应时间区间的监控数据。

    • MRS Manager在“服务概览”显示各个服务的“健康状态”“角色数”
    • 单击曲线图表上侧的图标,可显示具体的指标说明信息。

  4. 自定义监控指标报表。

    单击“定制”,勾选需要在MRS Manager显示的监控指标。单击“确定”保存并显示所选指标。单击“清除”可批量取消全部选中的指标项。

    MRS Manager支持统计的指标共14个,界面最多显示12个定制的监控指标。

  5. 用户可以选择页面自动刷新间隔的设置,也可以单击马上刷新。勾选“全屏”会将“系统概览”窗口最大化。

    支持三种参数值:

    • “每60秒刷新一次”:刷新间隔60秒。
    • “每120秒刷新一次”:刷新间隔120秒。
    • “停止刷新”:停止刷新。

  6. 导出监控指标报表。

    选择报表的时间范围。可供选择的选项如下,单击“导出”,Manager将生成指定时间范围内、已勾选的集群监控指标报表文件,请选择一个位置保存,并妥善保管该文件。

    如果需要查看指定时间范围的监控指标对应的分布曲线图,请单击“查看”,界面将显示用户自定义时间范围内选定指标的分布曲线图。

    用户需要了解服务和主机关键监控指标中最高、最低或平均监控数据形成的曲线,即资源分布情况时,可以在MRS Manager上查看,支持查询1小时以内的监控数据。

    用户也可以在MRS Manager上修改资源分布,使服务和主机的资源分布图表中,可以按自定义的数值显示一条或多条最高、最低监控数据形成的曲线。

    部分监控指标的资源分布不记录。

    • 查看服务监控指标的资源分布
      1. 在MRS Manager,单击“服务管理”。
      2. 单击服务列表中指定的服务名称。
      3. 单击“资源贡献排名”。

        “指标”中选择服务的关键指标,MRS Manager将显示过去1小时内指标的资源分布情况。

    • 查看主机监控指标的资源分布
      1. 在MRS Manager,单击“主机管理”。
      2. 单击主机列表中指定的主机名称。
      3. 单击“资源贡献排名”。

        “指标”中选择主机的关键指标,MRS Manager将显示过去1小时内指标的资源分布情况。

    • 配置资源分布
      1. 在MRS Manager,单击“系统设置”。
      2. 在“配置”区域“监控和告警配置”下,单击“资源贡献排名配置”。
      3. 修改资源分布的显示数量。最大值与最小值的资源分布显示数量总和不能大于5。

        “TOP数量”填写最大值的显示数量。

        “BOTTOM数量”填写最小值的显示数量。

      1. 单击“确定”保存设置。

        界面右上角提示“保存TOP数量和BOTTOM数量成功。”。

相关文档