云服务监控及告警全流程介绍
用户购买了华为云资源后,并且该资源已经对接了CES云监控,那么该云服务的监控指标会自动上报给CES,用户可在CES进行资源监控指标数据的查看及配置告警,快速对云上资源进行全面、精准监控。
应用场景
资源购买后需要对资源的运行状态进行全面监控。
前提条件
- 确认资源在账号下已购买。
- 该类云服务资源已经对接过CES,查看云服务是否对接过CES,可在官网指标对接文档中查看。
查看云服务监控指标
- 在华为云购买相关资源后,可登录云监控服务CES页面,找到左侧功能列表“云服务监控”。
- 单击“看板名称”列的云服务看板名称,即可进入资源详情页和概览页。
图2 云服务监控详情
资源详情:
- 资源详情页可以进行搜索、资源排序、告警个数查看等功能。
- 资源详情列表从名称或者查看监控指标入口,可以进入资源的指标详情页。
- 指标详情页会展示不同资源实例及下层子维度资源,可以进行切换查看不同的下层维度资源。
- 指标详情页可以支持批量查看不同资源的同一个监控指标。
- 支持对指标进行添加视图分组、以及自定义设置指标,可将关注的指标进行分门别类的管理。
图3 资源实例
云服务概览:
云服务概览是对该类云服务资源使用情况的总览,包括资源概览、告警统计、关键指标三个部分。
- 资源概况统计资源的总数及正在告警的资源个数,以及7天告警的资源数。
- 告警统计是对当前所选云产品正在发生的告警数量进行的统计和汇总。
- 关键指标展示该类云服务资源的重点业务指标,并支持自定义编辑指标,可根据业务需要对关键指标进行配置推荐。
图4 云服务概览
图5 关键指标
配置云服务告警规则
各类云服务需要给哪些指标配置告警,可参考最佳监控实践推荐的指标及告警策略。最佳实践如:华为云监控配置最佳实践 v5.3.1.xlsx。
步骤:
- 登录管理控制台。
- 单击“服务列表 > 云监控服务”。
- 选择“云服务监控 > 告警 > 告警规则 > 创建告警规则”进入创建告警规则页面。
- 依次进行页面内容配置,包括填写告警名称、告警类型、云产品、资源层级(建议选择云产品),监控范围包括:全部资源、资源分组、指定资源。
- 配置触发规则,可以选择关联模板(告警模板可以有默认模板和自定义模板,可先配置告警模板,在创建告警规则时选择关联模板即可),或者自定义创建,自定义创建会根据选择的云产品将对应云产品的监控指标展示出来进行配置告警。
- 配置发送通知,通知方式可以选择通知策略、通知组、主题订阅。
- 配置完成后,单击立即创建,即可完成对该云服务的告警规则配置。
图6 创建告警规则
查看云服务的告警记录
当接收到告警通知后,可在告警记录界面对云服务资源触发的告警进行搜索查看,可通过资源ID进行搜索,找到资源对应的告警信息。图7 告警记录