更新时间:2024-09-06 GMT+08:00

工作负载监控

工作负载监控是针对CCE、CCI工作负载的监控,通过工作负载监控您可以及时了解工作负载的资源使用、状态和告警等信息,以便快速响应处理告警或事件信息,保证工作负载顺畅运行。工作负载分为五种类型:无状态负载 Deployment、有状态负载 StatefulSet、守护进程 DaemonSet、普通任务Job、容器组 Pod。

功能介绍

  • 工作负载监控方案开箱即用。开通AOM之后,在工作负载监控页面,CCE、CCI的工作负载状态、CPU使用率、物理内存使用率等信息默认呈现。
    图1 工作负载监控
  • 用户自建k8s容器监控方案,当前只支持通过Prometheus的remote_write功能,将容器指标写入AOM指标库,通过指标浏览查询相关指标信息。
  • 工作负载监控是逐层下钻设计,层次关系为:工作负载->Pod实例->容器->进程,在界面上可直观查看各层关联关系。每层监控的内容包括指标、日志、告警等信息。
    图2 工作负载的详细信息
  • 在工作负载监控页面右上角,单击“关联应用”,按照界面提示操作,可将CCE的工作负载上报到AOM中,并挂载到“应用监控”页面左侧的应用树中以组件形式体现。

    如需使用“关联应用”功能,需提前在“菜单开关”中开启应用洞察的开关,详细操作请参见菜单开关

操作步骤

  1. 登录AOM 2.0控制台。
  2. 在左侧导航栏中选择“基础设施监控 > 工作负载”。
  3. 在页面右上角设置工作负载信息的统计条件。

    1. 设置时间范围,查看已设时间范围内上报的工作负载。可通过如下两种方式设置时间范围:

      方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时等,您可根据实际需要选择不同的时间粒度。

      方式二:通过开始时间和结束时间,自定义时间范围,您最长可设置为30天。

    2. 设置信息的刷新频率。单击,根据需要从下拉列表中选择,例如,手动刷新、1分钟等。

  4. 单击任一工作负载页签,即可在下方列表区域查看该工作负载的名称、状态、集群、命名空间等信息。

    • 在工作负载列表上方可按集群、命名空间、实例名称等设置搜索条件,实现工作负载过滤显示。

      拥有AOM FullAccess或者AOM ReadOnlyAccess权限的IAM用户,查询命名空间时需要登录云容器引擎 CCE的控制台,在左侧导航栏中选择“权限管理”,单击页面右上角的“添加权限”,单独进行权限设置。

    • 单击右上角的,可获取到3.a设置的时间范围内工作负载的最新信息。
    • 单击右上角的,通过选中/取消选中各展示项前的复选框,自定义列表项的展示/隐藏。
    • 单击工作负载名称,可查看该工作负载的详细信息。
      • 在“Pod实例”页签下,可查看该工作负载所有实例的概况。单击实例名称,可查看该实例下所有容器的资源使用与健康状态。
      • 在“监控视图”页签下,可视化展示该工作负载的资源使用情况。
      • 在“日志”页签下,可查看该工作负载的原始日志、实时日志详情和进行日志可视化,详情请参见日志流
      • 在“告警”页签下,可查看该工作负载的告警详情,详情请参见查看告警
      • 在“事件”页签下,可查看该工作负载的事件详情,详情请参见查看事件