更新时间:2024-08-05 GMT+08:00

工作负载监控

工作负载监控是针对CCE工作负载的监控,通过工作负载监控您可以及时了解工作负载的资源使用、状态和告警等信息,以便快速响应处理告警或事件信息,保证工作负载顺畅运行。工作负载分为五种类型:无状态负载 Deployment、有状态负载 StatefulSet、守护进程 DaemonSet、普通任务Job、容器组 Pod。

功能介绍

  • 工作负载监控方案开箱即用。开通AOM之后,在工作负载监控页面,CCE的工作负载状态、CPU使用率、物理内存使用率等信息默认呈现。
  • 用户自建k8s容器监控方案,当前只支持通过Prometheus的remote_write功能,将容器指标写入AOM指标库,通过指标浏览查询相关指标信息。
  • 工作负载监控是逐层下钻设计,层次关系为:工作负载->Pod实例->容器->进程,在界面上可直观查看各层关联关系。每层监控的内容包括指标、告警等信息。

操作步骤

  1. 登录AOM 2.0控制台。
  2. 在左侧导航栏中选择“容器洞察 > 工作负载”。
  3. 在页面右上角设置工作负载信息的统计条件。

    1. 设置时间范围,查看已设时间范围内上报的工作负载。可通过如下两种方式设置时间范围:

      方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时等,您可根据实际需要选择不同的时间粒度。

      方式二:通过开始时间和结束时间,自定义时间范围,您最长可设置为30天。

    2. 设置信息的刷新频率。单击,根据需要从下拉列表中选择,例如,手动刷新、1分钟等。

  4. 单击任一工作负载页签,即可在下方列表区域查看该工作负载的名称、状态、集群、命名空间等信息。

    • 在工作负载列表上方可按集群、命名空间等设置搜索条件,实现工作负载过滤显示。
    • 单击右上角的,可获取到3.a设置的时间范围内工作负载的最新信息。
    • 单击右上角的,通过选中/取消选中各展示项前的复选框,自定义列表项的展示/隐藏。
    • 单击工作负载名称,可查看该工作负载的详细信息。
      • 在“Pod实例”页签下,可查看该工作负载所有实例的概况。单击实例名称,可查看该实例下所有容器的资源使用与健康状态。
      • 在“监控视图”页签下,可视化展示该工作负载的资源使用情况。
      • 在“告警”页签下,可查看该工作负载的告警详情,详情请参见查看告警
      • 在“事件”页签下,可查看该工作负载的事件详情,详情请参见查看事件