更新时间:2025-08-07 GMT+08:00
通过AOM监控工作负载
工作负载监控是针对CCE工作负载的监控,通过工作负载监控您可以及时了解工作负载的资源使用、状态和告警等信息,以便快速响应处理告警或事件信息,保证工作负载顺畅运行。工作负载分为五种类型:无状态负载Deployment、有状态负载StatefulSet、守护进程DaemonSet、普通任务Job、容器组Pod。
功能介绍
- 工作负载监控方案开箱即用。开通AOM之后,在工作负载监控页面,CCE的工作负载状态、CPU使用率、物理内存使用率等信息默认呈现。
- 用户自建k8s容器监控方案,当前只支持通过Prometheus的remote_write功能,将容器指标写入AOM指标库,通过指标浏览查询相关指标信息。
- 工作负载监控是逐层下钻设计,层次关系为:工作负载->Pod实例->容器->进程,在界面上可直观查看各层关联关系。每层监控的内容包括指标、告警等信息。
通过AOM监控工作负载
- 登录AOM 2.0控制台。
- 在左侧导航栏中选择“基础设施监控 >容器洞察 > 工作负载”。
- 在页面右上角设置工作负载信息的统计条件。
- 单击任一工作负载页签,即可在下方列表区域查看该工作负载的名称、状态、集群、命名空间等信息。
- 在工作负载列表上方可按集群、命名空间等设置搜索条件,实现工作负载过滤显示。
拥有AOM ReadOnlyAccess权限的IAM用户,查询命名空间时需要登录云容器引擎CCE的控制台,在左侧导航栏中选择“权限管理”,单击页面右上角的“添加权限”,单独进行权限设置。其中CCE命名空间权限需授予用户或用户组全部命名空间的只读权限(view)或自定义权限。如果是自定义权限,需至少包含list操作权限,并指定namespaces资源。
- 单击右上角的
,可获取到3.a设置的时间范围内工作负载的最新信息。
- 单击右上角的
,通过选中/取消选中各展示项前的复选框,自定义列表项的展示/隐藏。
- 单击工作负载名称,可查看该工作负载的详细信息。
- 在“Pod实例”页签下,可查看该工作负载所有实例的概况。单击实例名称,可查看该实例下所有容器的资源使用与健康状态。
- 在“监控视图”页签下,可视化展示该工作负载的资源使用情况。
- 在“日志”页签下,可查看该工作负载的原始日志、实时日志详情和进行日志可视化。
- 在“告警”页签下,可查看该工作负载的告警详情,详情请参见查看AOM告警或事件。
- 在“事件”页签下,可查看该工作负载的事件详情,详情请参见查看AOM告警或事件。
- 在工作负载列表上方可按集群、命名空间等设置搜索条件,实现工作负载过滤显示。
父主题: 基础设施监控