更新时间:2024-06-13 GMT+08:00
分享

ALM-15795031 CPU繁忙

告警解释

The CPU usage exceeded the pre-set overload threshold.(TrapSeverity=[TrapSeverity], ProbableCause=[ProbableCause], EventType=[EventType], PhysicalIndex=[PhysicalIndex], PhysicalName=[PhysicalName], RelativeResource=[RelativeResource], UsageType=[UsageType], SubIndex=[SubIndex], CpuUsage=[CpuUsage], Unit=[Unit], CpuUsageThreshold=[CpuUsageThreshold])

对CPU的利用率进行持续采样。一个采样周期(CPU持续过载次数*采样时间间隔)中:如果每次采样的CPU利用率均大于过载门限时,产生该告警。

告警属性

告警ID

OID

告警级别

告警类型

15795031

1.3.6.1.4.1.2011.5.25.129.2.4.1

紧急

业务质量告警

告警参数

参数名称 参数含义

TrapSeverity

告警级别。

ProbableCause

告警原因。

EventType

告警类别。

PhysicalIndex

物理索引。

PhysicalName

实体名称。

RelativeResource

相关资源名称。

UsageType

过载类型。

SubIndex

实体子索引。

CpuUsage

CPU使用率。

Unit

单位。

CpuUsageThreshold

CPU门限值。

对系统的影响

  • 原因74299:在不区分业务的情况下,单板CPU利用率超过设定的过载门限。

    短时间内对业务没有影响,但长期CPU利用率过高,可能对业务不能及时处理,影响系统性能。例如用户界面的响应速度、邻居状态或路由收敛性能等。

  • 原因74300:单板上数据面CPU使用率超过告警阈值,数据面CPU使用率包含基础转发业务和其他数据面业务CPU使用率。

    设备单个CPU的转发CPU使用率超过告警阈值,如果转发流量超过设备的转发性能,会影响业务的转发,出现丢包情况。

可能原因

  • 原因74299:在不区分业务的情况下,单板CPU利用率超过设定的过载门限。
  • 原因74300:单板上数据面CPU使用率超过告警阈值,数据面CPU使用率包含基础转发业务和其他数据面业务CPU使用率。

处理步骤

  • 原因74299:在不区分业务的情况下,单板CPU利用率超过设定的过载门限。
    1. 执行display cpu-usage命令查看CPU使用率及其过载门限值。
      • 如果CPU使用率高于过载门限值,则请执行步骤2
      • 如果CPU使用率低于过载门限值,则请执行步骤4
    2. 减少不需要的业务和配置,降低CPU使用率,检查告警是否恢复。
      • 如果不再产生告警,则此告警问题解决。
      • 如果继续产生告警,则请执行步骤3
    3. 执行set cpu-usage threshold命令调整过载门限值,检查告警是否恢复。
      • 如果不再产生告警,则此告警问题解决。
      • 如果继续产生告警,则请执行步骤4.
    4. 请收集告警信息、日志信息和配置信息,联系技术工程师进行处理。
  • 原因74300:单板上数据面CPU使用率超过告警阈值,数据面CPU使用率包含基础转发业务和其他数据面业务CPU使用率。

    参考display cpu-usage中服务的使用率确认具体业务,根据业务需要扩容。

告警清除

此告警修复后,系统会自动清除此告警,当前告警页面将不再显示该告警,无需手工清除。

相关文档