更新时间:2024-04-25 GMT+08:00

收集Kubernetes事件

费用说明

LTS创建日志组免费,并每月赠送每个账号一定量免费日志采集额度,超过免费额度部分将产生费用(价格计算器)。

Kubernetes事件上报云日志服务(LTS)

集群未安装CCE 云原生日志采集插件

安装CCE 云原生日志采集插件时,可通过勾选采集Kubernetes事件,创建默认日志采集策略,采集所有事件上报到LTS。安装方法见:通过云原生日志采集插件采集容器日志

集群已安装CCE 云原生日志采集插件

  1. 登录云容器引擎(CCE)控制台,单击集群名称进入集群,选择左侧导航栏的“日志中心”。
  2. 右上角单击“日志采集策略”,将显示当前集群所有上报LTS的日志策略。
  3. 单击上方“创建日志策略”,输入要采集的配置信息。

    策略模板:若安装插件时未勾选采集Kubernetes事件,或者删除了对应的日志策略,可通过该方式重新创建默认事件采集策略。

  4. 事件查看:可直接在“日志中心”页面查看,选择日志策略配置的日志流名称,即可查看上报到云日志服务(LTS)的事件。

Kubernetes事件上报应用运维管理(AOM)

自1.3.2版本起,云原生日志采集插件默认会将上报所有Warning级别事件以及部分Normal级别事件到应用运维管理(AOM),上报的事件可用于配置告警。当集群版本为1.19.16、1.21.11、1.23.9或1.25.4及以上时,安装云原生日志采集插件后,事件上报AOM将不再由控制面组件上报,改为由云原生日志采集插件上报,卸载插件后将不再上报事件到AOM。

自定义事件上报

若已上报的事件不能满足需求,可通过修改配置,修改需要上报到应用运维管理(AOM)的事件。

通过控制台配置

  1. 登录云容器引擎(CCE)控制台,单击集群名称进入集群,选择左侧导航栏的“配置中心”。
  2. 选择“监控运维配置”页签,在“日志配置”中修改Kubernetes事件上报至AOM的策略。

    • 异常事件上报:默认开启,会将所有异常事件上报至AOM。您可以单击“配置黑名单”,将不需要上报的事件添加至黑名单进行管理。
    • 普通事件上报:开启后,会将普通事件上报至AOM,系统默认配置了部分需要上报的普通事件。如果您需要自定义上报的事件,可以单击“配置白名单”,将需要上报添加至白名单进行管理。

  3. 配置修改完成后,单击“确认配置”。

通过kubectl配置

  1. 在集群上执行以下命令,编辑当前的事件采集配置。

    kubectl edit logconfig -n kube-system default-event-aom

  2. 根据需要修改事件采集配置。

    apiVersion: logging.openvessel.io/v1
    kind: LogConfig
    metadata:
      annotations:
        helm.sh/resource-policy: keep
      name: default-event-aom
      namespace: kube-system
    spec:
      inputDetail:    #采集端配置
        type: event    #采集端类型,请勿修改
        event:
          normalEvents:    #Normal级别事件采集配置
            enable: true    #是否开启Normal级别事件采集
            includeNames:    #需要采集的事件名,不指定则采集所有事件
            - NotTriggerScaleUp
            excludeNames:    #不采集的事件名,不指定则采集所有事件
            - ScaleDown
          warningEvents:    #Warning级别事件采集配置
            enable: true    #是否开启Warning级别事件采集
            includeNames:    #需要采集的事件名,不指定则采集所有事件
            - NotTriggerScaleUp
            excludeNames:    #不采集的事件名,不指定则采集所有事件
            - ScaleDown
      outputDetail:
        type: AOM    #输出端类型,请勿修改
        AOM:
          events:
          - name: DeleteNodeWithNoServer    #事件名,必选
            resourceType: Namespace    #事件对应的资源类型
            severity: Major    #事件上报到AOM后的事件级别,默认Major。可选值:Critical:紧急;Major:重要;Minor:次要;Info:提示