更新时间:2024-01-04 GMT+08:00

图实例运维监控

GES为用户提供了一个多维度运维监控的界面,为客户图实例的稳定运行提供保驾护航的能力。该功能对图实例所使用磁盘、网络、OS指标数据,集群运行关键性能指标数据进行收集、监控、分析,及时暴露数据库中关键故障及性能问题,指导客户进行优化解决。

  • 图实例运维监控看板只支持2.3.17及以上版本的图。
  • 一万边规格为开发学习类型,暂不支持运维监控看板。
  • 持久化版图数据库,暂不支持图实例监控。

图实例运维监控页面

  1. 登录图引擎服务管理控制台。在左侧导航栏,选择“图管理”
  2. 在图管理列表中,指定图实例的操作列,单击“更多 > 运维监控面板”,进入该图实例的运维监控页面。关于各项监控项指标,请参考监控项列表
    图1 运维监控页面

实例概况

进入图实例的运维监控页面后,您可以看到图实例概况,展示了图实例的状态,实时资源消耗,告警统计,资源消耗,业务负载等信息。下面为您进行详细说明各个模块的作用:

  • 图集群状态

    在图集群状态模块,您可以浏览当前图实例基本信息和容量、请求数等统计信息。

    1. 集群信息:包括图规格、CPU架构。
    2. 集群容量:包括点和边的使用量、容量和使用率。
    3. 集群节点:包括CN节点可用数量/总数量、DN节点可用数量/总数量。
    4. 集群请求数统计:包括等待中的读请求个数、运行中的读请求个数、等待中的写请求个数、运行中的写请求个数。
    图2 图集群状态
  • 告警统计

    在告警统计模块,您可以查看当前实例未消除的所有告警,以及过去7天实例产生的所有告警信息。

    图3 告警统计
  • 实例资源

    在实例资源模块,您可以查看当前实例资源使用情况,包括“CPU使用率”,“磁盘I/O”,“磁盘使用率”,“内存使用率”,“网络I/O值”。单击对应资源指标可显示过去72小时该指标的变化趋势,以及该资源当前时刻的Top5节点使用情况。

    图4 实例资源
  • 业务负载

    在业务负载模块,您可以查看当前数据库业务负载指标QPS在过去72小时该指标的变化趋势。

    图5 业务负载