更新时间:2024-11-12 GMT+08:00
ALM-50227 Doris租户查询并发数超过阈值
告警解释
系统每30秒周期性检查租户FE节点的查询并发数,当检查到该值超出阈值(默认值为90%)时产生该告警。
当检测到FE的查询并发数低于阈值时,告警恢复。
该告警仅适用于MRS 3.3.1及之后版本。
告警属性
告警ID |
告警级别 |
是否可自动清除 |
---|---|---|
50227 |
重要 |
是 |
告警参数
类别 |
参数名称 |
参数含义 |
---|---|---|
定位信息 |
来源 |
产生告警的集群或系统名称。 |
服务名 |
产生告警的服务名称。 |
|
角色名 |
产生告警的角色名称。 |
|
主机名 |
产生告警的主机名。 |
|
附加信息 |
Detail |
系统当前指标取值满足自定义的告警设置条件。 |
对系统的影响
当查询并发数过大时,会消耗大量的系统资源,导致系统响应时间变慢,甚至拒绝后续查询。
可能原因
租户业务量过大。
处理步骤
查看租户FE实际查询并发数。
- 登录FusionInsight Manager,选择“运维 > 告警 > 告警”,选中“告警ID”为“50227”的告警,查看“定位信息”中的角色名并确定实例的IP地址。
- 选择“集群 > 服务 > Doris > 实例”,选择上报告警的FE实例,单击“图表”,在“图表分类”中选择“租户资源”,查看“租户查询并发数”图表中实际的查询并发数是否大于阈值(默认值为90%)。
- 确认业务是否在告警时间段内有大量的任务执行。
- 在FusionInsight Manager页面,选择“运维 > 告警 > 阈值设置 > 待操作的集群名称 > Doris > 租户资源”,根据实际业务适当调大该告警的阈值和平滑次数。等待任务结束之后,查看告警是否消除。
- 是,操作结束。
- 否,执行5。
收集故障信息
告警清除
此告警修复后,系统会自动清除此告警,无需手工清除。
参考信息
不涉及。
父主题: MRS集群告警处理参考