文档首页/ MapReduce服务 MRS/ 用户指南/ MRS集群运维/ MRS集群告警处理参考/ ALM-50818 StoreWorker SDK网络连接数占配置上限的百分比超过阈值
更新时间:2025-12-11 GMT+08:00
分享

ALM-50818 StoreWorker SDK网络连接数占配置上限的百分比超过阈值

告警解释

系统按30秒周期性检测组件StoreWorker SDK网络连接数占配置上限的百分比,当检测到SDK网络连接数占配置上限的百分比超过阈值后产生该告警。

当检测到StoreWorker SDK网络连接数占配置上限的百分比在阈值内时告警恢复。

告警属性

告警ID

告警级别

告警类型

业务类型

是否可自动清除

50818

次要

业务质量告警

MemArtsStore

告警参数

参数名称

参数含义

来源

产生告警的集群或系统名称

服务名

产生告警的服务名称

角色名

产生告警的角色名称

主机名

产生告警的主机名

对系统的影响

连接数太多将导致内存占用增多,导致服务处理效率下降,进一步可能导致任务失败。

可能原因

  • 负载倾斜性过大,负载压力过大。
  • 告警阈值配置或者平滑次数配置不合理。

处理步骤

检查告警阈值配置或者平滑次数配置是否合理

  1. 登录FusionInsight Manager,选择“运维 > 告警 > 阈值设置 > MemArtsStore > 资源 > Worker SDK网络连接数占配置上限的百分比 (StoreWorker)”。
  2. 单击“平滑次数”后的修改按钮,基于实际使用情况,修改平滑次数配置项,单击“确定”。

    平滑次数为在告警检查阶段连续检查多少次超过阈值,则发送告警。

  3. 单击“操作”列的“修改”,基于实际使用情况,更改告警阈值,单击“确定”。
  4. 等待2分钟,查看告警是否自动恢复。

    • 是,处理完毕。
    • 否,执行步骤 5

收集故障信息

  1. 在FusionInsight Manager首页,选择“运维 > 日志 > 下载”。
  2. 在“服务”中勾选待操作集群的“MemArtsStore”。
  3. 单击右上角的编辑按钮设置日志收集的“开始时间”和“结束时间”,分别为告警产生时间的前后10分钟,单击“下载”。
  4. 请联系运维人员,并发送已收集的故障日志信息。

告警清除

此告警修复后,系统会自动清除此告警,无需手工清除。

参考信息

不涉及。

相关文档