配置业务告警
AppStage运维中心支持对接入的日志配置告警,当日志出现异常告警后,可以通过配置告警通知,及时掌握并处理告警,避免影响业务正常运行。
步骤一:创建聚合表
- 进入运维中心工作台。
- 在顶部导航栏选择自有服务。
- 单击,选择“运维 > 监控服务(ServiceInsight)”。
- 选择左侧导航栏的“运维数据开发 > 数据开发”,进入“数据开发”页面。
- 单击“数据管理 > ClickHouse”,进入ClickHouse页面。
- 单击日志接入时选择或自动创建的Topic后的“创建聚合表”,Topic可在“日志空间”页面查看,如图1所示。
- 配置聚合表参数,配置完成后,单击“确定”。
步骤二:新建指标
- 在“数据开发”页面,选择“数据治理 > 指标仓库”。
- 单击逻辑主体后的“新建”。
- 配置逻辑主体参数,参数说明如表1所示,配置完成后,单击“确定”。
- 在“指标仓库”页面,单击已创建的逻辑主体。
- 单击逻辑主体页面的“新建指标”,选择“新建单个指标”。
- 配置指标参数,参数说明如表2所示,配置完成后,单击“创建”。
表2 配置指标参数说明 参数名称
参数说明
类型
选择指标类型。
英文名称
自定义英文名称。
中文名称
自定义中文名称。
指标等级
选择指标等级。
描述
输入描述信息。
开放名称
-
指标类型
根据指标的类型分为RequestCount、DelayTime、SuccessRate、FailureRate、Speed、Bandwidth。
逻辑主体
选择指标来源的逻辑主体。
标签列表
-
指标责任人
-
开放状态
-
抽象指标
-
是否多聚合字段
-
聚合类型
选择指标的统计方式。
聚合字段
指标的度量对象。
过滤器
依据业务限定条件,给指标设置过滤规则,支持AND、OR多层嵌套过滤条件,节点类型为NODE。
举例:有5个过滤条件ABCDE,过滤条件汇总后为(A AND B)OR (C AND D AND E),ABCDE即为NODE节点。
步骤三:配置异常检测任务
- 在监控服务页面,选择左侧导航栏的“AI辅助诊断 > 异常检测”,进入“异常检测”页面。
- 单击“快速配置”,进入任务快速配置页面。
- 配置任务参数,参数说明如表3所示,配置完成后,单击“Save”,弹出任务进度窗口,等待任务完成。
表3 配置任务参数说明 参数名称
参数说明
指标
选择指标仓库中新建的指标。
任务名称
自定义任务名称,只能包含字母、数字、下划线。
告警名
设置告警名称,会展示在告警列表中。
数据源类型
-
告警级别
选择告警级别,即notice、minor、major和critical,分别对应提示、一般、严重和紧急。
描述
输入任务描述。
维度列表
来自于指标的逻辑实体上的维度 选择异常检测需要对哪些维度做检测。
ALL维度列表
指需要对哪些维度进行all维度的配置。
维度过滤设置
维度过滤器,用于按照维度和请求量进行过滤。
指标类型
指标的类型,针对指标的定义进行选择。
算法类型
选择异常检测算法,支持固定阈值和动态阈值。
- 固定阈值:简单设置上限或者下限值。一旦数据超过上限或是低于下限则发生异常。
- 动态阈值:通过训练历史数据,实现对数据特征的学习,构建数据的模型。并利用模型来预测数据的趋势走向。当实际值和预测值相差过大,认为异常。
上限
当算法类型选择固定阈值时,需要设置上限。
下限
当算法类型选择固定阈值时,需要设置下限。
预估维度数
-