新增语音值班配置
告警的通知在所有的告警处理的链路结束以后才会发生。告警处理模块会根据上报告警的上下文获取告警的值班配置,值班配置由业务预置。配置对应的责任人,当告警生成时,通过WeLink、短信或电话形式,快速通知责任人。
新建语音值班配置前需要先新增模板。模板是产品级共享,模板列表展示所选服务所属产品下的所有模板配置。
前提条件
已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。
新增模板
- 进入AppStage运维中心。
- 在顶部导航栏选择服务。
- 单击,选择“运维 > 监控服务(ServiceInsight)”。
- 选择左侧导航栏的 ,进入语音值班配置页面。
- 单击“模板管理”,切换至“模板管理”页签,单击“新增模板”。
- 输入模板名称并选择模板类型,模板类型可选按班次、按周或按月,模板类型说明如表1所示。
- 配置值班信息,值班信息参数说明如下:
- 开始时间、结束时间:设置具体值班时间。
- 第一责任人、第二责任人、扩展人员:设置值班时间段告警的值班责任人。
- 处理方式:包括立即通知、语音通知、转监控中心和不通知四种方式。
- 立即通知:告警上报后会立刻触发通知流程。
- 语音通知:会有三分钟左右的延迟,取决于告警上报的时间。
- 转监控中心:给AppStage运维中心的监控中心人员打电话。
- 不通知:告警上报后不通知。
如果是按月类型,可以单击日历中的一天,会显示“新增值班配置”的弹框,默认的值班日期是单击的这一天,同时也可以选择将时间往前或者往后调;也可以下载模板,配置完成后导入,如所示图1。 - 配置完成后,单击“保存”。
新增语音值班配置
- 进入AppStage运维中心。
- 在顶部导航栏选择服务。
- 单击,选择“运维 > 监控服务(ServiceInsight)”。
- 选择左侧导航栏的 ,进入语音值班配置页面。
- 在“值班管理”页签,单击“新增配置”。
- 配置语音值班参数,参数说明如表2所示,配置完成后,单击“保存”。
表2 语音值班配置参数说明 参数名称
参数说明
自有服务
选择日志所在服务名称。
短信通知
选择是否开启短信通知。
开启短信通知后,当产生告警时,所选模板中的值班责任人会收到短信。
短信规则:短信最多显示134个字,当内容超过134个字时,剩余内容会被省略,短信规则根据告警来源不同,拼接规则不同,具体如下:
- appstage内部上报:【华为云应用平台】服务名|告警级别|发生时间|指标名称|details。例如【华为云应用平台】MessageSMS |notice|2024-04-01 10:35:00|30S及时率_分运营商_10分钟_动态_GZ|details。
- 云监控服务CES上报:【华为云应用平台】服务名|告警级别|告警时间|命名空间|资源名称|指标名称|当前值(阈值)|Region。例如 【华为云应用平台】WebCommunityService|重要|2024/04/01 09:49:46|ECS|openlab_MasterNode02|CPU使用率|99.35 %(阈值80 %)|华北-乌兰察布一。
- 应用运维服务AOM上报(上报的告警体须为json格式):【华为云应用平台】服务名|告警级别|告警时间|集群名称|指标名称|依据的告警规则|当前值(阈值)。例如【华为云应用平台】Service|重要|2024/08/28 10:23:34|cce-wiseeyetest-bj4-turbo-opsagent-001|diskUsedRate|异常告警|10.02(阈值:5)。
welink通知
配置运维中心对接华为云WeLink后会显示该参数,可以选择是否开启welink通知。
开启welink通知后,当产生告警时,所选模板中的值班责任人(已配置WeLink属性)会收到welink通知。
责任人
选择告警责任人。
级别
选择需要通知的告警级别。
语音呼叫
选择是否开启语音呼叫。
开启后会按照所选模板配置的处理方式确定是否进行呼叫。
说明:语音呼叫规则如下:
- 语音呼叫会依次呼叫第一责任人、第二责任人、告警责任人(所选的责任人),每个责任人最多呼叫3次,每次间隔2分钟,如均未接听,则不会再次呼叫。
- 如果告警责任人与第一责任人相同,呼叫至告警责任人时会拨打一次,其他重复场景时会跳过下一个责任人。
关键字
默认关键字为“/”,表示匹配所有的告警。
增加模板匹配时,可以单击关键字后的“编辑”,匹配消息、主机名、主机IP、serviceId等告警关键字。
模板
选择模板,可选模板范围为当前服务所在产品下的所有模板。
可以单击模板后的“+”号可以增加匹配,具体操作请参考新增模板。