图实例运维监控
GES为用户提供了一个多维度运维监控的界面,为客户图实例的稳定运行提供保驾护航的能力。该功能对图实例所使用磁盘、网络、OS指标数据,集群运行关键性能指标数据进行收集、监控、分析,及时暴露数据库中关键故障及性能问题,指导客户进行优化解决。
- 图实例运维监控看板只支持2.3.17及以上版本的图。
- 一万边规格为开发学习类型,暂不支持运维监控看板。
- 持久化版图数据库,暂不支持图实例监控。
图实例运维监控页面
- 登录图引擎服务管理控制台。在左侧导航栏,选择“图管理”。
- 在图管理列表中,指定图实例的操作列,单击“更多 > 运维监控面板”,进入该图实例的运维监控页面。关于各项监控项指标,请参考监控项列表。
图1 运维监控页面
实例概况
进入图实例的运维监控页面后,您可以看到图实例概况,展示了图实例的状态,实时资源消耗,资源消耗,业务负载等信息。下面为您进行详细说明各个模块的作用:
- 图集群状态
在图集群状态模块,您可以浏览当前图实例基本信息和容量、请求数等统计信息。
- 集群信息:包括图规格、CPU架构。
- 集群容量:包括点和边的使用量、容量和使用率。
- 集群节点:包括CN节点可用数量/总数量、DN节点可用数量/总数量。
- 集群请求数统计:包括等待中的读请求个数、运行中的读请求个数、等待中的写请求个数、运行中的写请求个数。
图2 图集群状态
- 告警统计
在告警统计模块,您可以查看当前实例未消除的所有告警,以及过去7天实例产生的所有告警信息。
图3 告警统计
- 实例资源
在实例资源模块,您可以查看当前实例资源使用情况,包括“CPU使用率”,“磁盘I/O”,“磁盘使用率”,“内存使用率”,“网络I/O值”。单击对应资源指标可显示过去72小时该指标的变化趋势,以及该资源当前时刻的Top5节点使用情况。
图4 实例资源
- 业务负载
在业务负载模块,您可以查看当前数据库业务负载指标QPS在过去72小时该指标的变化趋势。
图5 业务负载