更新时间:2024-09-24 GMT+08:00
分享

管理监控采集任务

您可以简单、方便地可视化管理采集任务,所有的配置均可在升级云原生监控插件时得到保留。

前提条件

集群中已安装云原生监控插件3.11.0及以上版本。

管理监控采集任务

开启默认关闭的采集任务、添加基础免费指标之外的指标后,若您已对接AOM,AOM服务会按量收取费用。具体请参考价格详情

  1. 登录CCE控制台,单击集群名称进入集群详情页。
  2. 在左侧导航栏中选择“配置中心”,切换至“监控运维配置”页签。
  3. 修改“采集配置”

    监控采集任务配置由系统预置采集配置ServiceMonitor采集配置PodMonitor采集配置Targets采集配置配置项共同提供。

系统预置采集配置

为保证插件默认行为的一致性,系统预置采集功能默认不开启,强烈建议您开启系统预置采集功能。

开启预置采集后,系统预置的采集任务会由ServiceMonitor/PodMonitor形式转换为方便可视化管理的采集任务形式,您可以方便地对云原生监控插件的系统预置采集任务进行管理,按需开启或关闭采集任务,添加基础免费指标外的采集指标等。

您对系统预置采集任务的管理,在插件升级时可以得到继承和保留。与此同时,kube-state-metrics和node-exporter两个工作负载也会升级为由Operator统一管理,您后续对这两个工作负载的个性化配置也会在插件升级时最大程度的得到保留。

  • 指标采集管理

    您可按需选择每一个系统预置采集任务的指标采集行为进行管理:

    • 若您选择采集全量指标,则会采集该采集任务的所有指标。
    • 若您选择指标采集白名单,则可以按需编辑白名单(基础免费指标无需添加),更加精确的控制自定义采集内容,降低您集群的资源消耗及指标上报成本。
  • 采集任务周期管理

    您可以按需对特定的系统采集任务的采集周期进行个性化配置。

    建议您保持kubelet、kubelet-cadvisor、kube-state-metrics、virtual-kubelet-pods四个采集任务的采集周期一致。

  • 采集任务启停

    您可以按需开启或关闭系统采集任务。

ServiceMonitor采集配置

您可以按需创建、修改、删除、启停ServiceMonitor。关于ServiceMonitor的创建方式请参见配置Service Monitor监控自定义指标

PodMonitor采集配置

您可以按需创建、修改、删除、启停PodMonitor。关于PodMonitor的创建方式请参见配置Pod Monitor监控自定义指标

Targets采集配置

您可以在targets页面方便的查看您的采集任务状态,包含采集端点、标签、最新采集时间、最新采集耗时、最新采集Sample数、错误信息。

若您的云原生监控插件开启了分片,则会有多个采集实例,可在采集实例处进行切换。

在云原生监控插件本地数据存储关闭的情况下,采集端点支持单击直接访问,查看采集结果,方便您对采集任务进行查看和分析管理。

采集端点访问403的原因是什么?该如何处理?

问题根因

您的采集端点对应的采集任务ServiceMonitor/PodMonitor配置了认证,出于安全考虑,页面访问默认不支持访问需认证的端点。

解决方案:您可以通过配置,允许访问带认证的端点。

配置允许访问带认证的端点,会导致您需认证的端点可在集群内通过访问prometheus-lightweight服务的方式直接访问,因此请勿将prometheus-lightweight服务端口暴露至集群外部。

  1. 登录CCE控制台,单击集群名称进入集群详情页。
  2. 在左侧导航栏中选择“配置与密钥”,并切换至“全部命名空间”,找到名为“persistent-user-config”的配置项。
  3. 单击“更新”,对lightweight-user-config.yaml配置数据进行编辑,在operatorConfigOverride字段下增加一条配置。
    customSettings:
      operatorEnvOverride: []
      operatorConfigOverride:
      - --target-response-auto-auth=true
      promAdapterConfigOverride: []
  4. 单击“确定”保存配置项,等待约1分钟即可生效。

相关文档