总览
总览由资源监控和站点监控两部分组成。通过查看总览,让用户实时了解各云服务的资源告警和站点响应情况。
约束与限制
总览页面会统计全部资源数据,当用户使用了企业项目授权,也会统计非当前企业项目管理下的数据,如果查看具体资源,页面会提示权限不足。
查看云服务资源监控
资源监控是以资源分组维度横向展示和各个服务资源维度纵向分布,将各个资源的实时告警情况进行展示,用户可按照不同维度对资源告警进行关注,方便高效管理您的资源。下面将介绍资源监控如何查看和使用。
- 登录云监控服务管理控制台。
- 单击页面左侧的“总览”,进入总览界面。
- 总览页面左上角统计了当前账号下的资源总数和正在告警资源数。
- 在资源监控页面的左侧展示了全部资源的健康评分、资源总数和正在告警的资源数,正在告警的资源数按照告警级别展开。
- 健康评分的计算公式为:健康评分的计算公式为:健康评分=(无告警资源个数/总资源个数)*100 (仅取整数)
- 新版总览与旧版总览页面中数据的统计方式不同,可能会导致新版与旧版页面中统计的资源总数、正在告警资源数的结果不同,旧版总览页面的数据统计接口已不再迭代优化,请以新版总览页面数据为准。
- 用户可以查看各云服务下的资源实例分布情况,也可以单击某个资源分组,查看资源分组中对应的服务资源。
- 单击服务资源,在右侧窗口可查看看云服务资源中的告警详情。
图1 查看服务监控详情
- 单击实例名称,可以跳转到告警记录页面,并按照资源ID和资源类型过滤出该实例下所有正在上报告警的告警记录。
- 单击实例名称前面的“
”,可以查看该实例的所有告警记录和对应的告警策略。
- 单击告警策略右侧的“查看详情”,可以跳转到告警记录页面,并按照告警级别、告警规则ID、资源ID和资源类型过滤出该实例下符合当前选择的告警策略的正在上报告警的告警记录。
查看云服务关键指标
在资源监控页面下方还展示了服务资源自主推荐的关键指标的Top 5和当前维度下所有实例的平均值。
- 登录云监控服务管理控制台。
- 单击页面左侧的“总览”,进入总览界面。
- 单击关键指标区域右上角的下拉框,可选择资源维度展示资源详情,也可选择其它资源完成看板切换。
图2 查看关键指标的监控详情
- 单击关键指标右上角的“
”,可以根据需要重新选择指标,也可以配置指标的聚合方式和图表类型。
聚合方式支持选择平均值、求和值、最大值和最小值。图表类型支持选择柱状图 、条形图、环形柱状图和极坐标柱状图。
- 单击图表右上方的“
”并在提示框中单击“确认”,可以删除当前展示的指标。
站点监控
站点监控展示了目标站点的响应时间和可用性、近一小时响应时间数据平均值和近一小时可用性数据平均值。
目标站点响应时间展示出延时高Top 5的站点名称以及响应时间默认轮播展示所有站点资源的探测点响应时间,选择单个站点名称后地图会轮播展示所选站点各探测点的响应时间,方便用户了解站点整体性能,及时处理异常情况。
目标站点可用性以小时为周期进行统计,开通监控后,1小时后可查看可用性监控图表。
可用性 =(每小时探测的总次数 - 每小时返回异常状态次数)/ 每小时探测的总次数 * 100%