更新时间:2024-12-02 GMT+08:00
分享

为伙伴云集群开启监控

本章节讲述为伙伴云集群开启监控的操作流程。

前提条件

已将伙伴云集群注册到UCS中,具体操作请参见伙伴云集群概述

准备网络环境

伙伴云集群的数据接入方式支持公网接入和私网接入。

  • 公网接入是通过公网Internet接入,要求集群能够访问公网,具有弹性灵活、成本低、易接入的优势。如果对网络质量没有要求,只想采用更简便的方式接入,那么公网接入是个不错的选择。

    公网接入要求集群能够访问公网,请确保集群已符合此条件,否则会接入失败。

  • 私网接入是通过云专线(DC)或虚拟专用网络(VPN)服务将伙伴云网络与云上虚拟私有云(VPC)连通,并利用VPC终端节点通过内网与容器智能分析建立连接,具有高速、低时延、安全的优势。
    图1 私网接入原理

    因此,在开启之前,您需要准备满足一个云上虚拟私有云(VPC),并将伙伴云厂商的网络环境与该VPC连通。VPC子网网段不能与伙伴云中已使用的网络网段重叠,否则将无法接入集群,例如,伙伴云中已使用的VPC子网为192.168.1.0/24,那么华为云VPC中不能使用192.168.1.0/24这个子网。

    网络连通可以选用如下两种方案:

为集群开启监控

  1. 登录UCS控制台,在左侧导航栏中单击“容器智能分析”
  2. 选择一个容器舰队或者未加入舰队的集群,并单击右上角“开启监控”按钮。

    图2 选择舰队或未加入舰队的集群

  3. 选择一个伙伴云集群。
  4. 单击“下一步:接入配置”,完成网络配置。

    • 数据接入方式:支持选择“公网接入”和“私网接入”。
    • 数据上报区域:选择数据上报的区域,和已连通伙伴云网络的VPC属于同一区域。
    • 项目列表:如果开通了IAM项目,还需要选择一个项目。
    • 网络配置:数据接入方式为“私网接入”时需要配置。

      选择VPC终端节点:可选择已有VPC终端节点(VPCEP),或者新建VPC终端节点(VPCEP)。

      在已连通伙伴云网络的VPC中创建VPC终端节点(VPCEP)连通容器智能分析数据上报接收点,可选择已有私网接入点,当选择新建私网接入点时将会收取0.1元/小时的VPCEP资源费用。

      创建私网接入点将会创建一个VPCEP终端节点和一个DNS内网域名,需保证主账号有相应资源的配额。另外,还需要确保页面选择的子网存在可用IP。

  5. 完成指标采集配置。

    规格配置

    • 部署模式:支持Agent模式和Server模式。Agent模式占用集群资源较低,为集群提供普罗指标采集能力,但不支持基于自定义普罗语句的HPA及健康诊断功能。Server模式为集群提供普罗指标采集能力,支持基于自定义普罗语句的HPA及健康诊断功能,依赖PVC,内存消耗较大。
    • 插件规格:如果部署模式选择“Agent模式”,插件规格为默认值。如果部署模式选择“Server模式”,插件规格包括演示规格(100容器以内)、小规格(2000容器以内)、中规格(5000容器以内)和大规格(超过5000容器)四种规格。不同规格对集群的CPU、内存等资源要求不同。不同插件规格占用的资源配额可参考不同规格的资源配额要求

    参数配置

    • 对接方式:当前仅支持接入AOM服务。
    • AOM实例:容器监控会将指标统一上报给AOM服务,因此需要选择一个Prometheus for CCE 类型的AOM实例。默认指标是免费的,而自定义指标将由AOM服务收费,收费标准请参见AOM计费说明
    • 采集周期:普罗采集指标数据并上报的时间周期。取值范围10~60秒,默认为15秒。
    • 存储:(部署模式选择“Server模式”时需要配置)用于普罗数据的临时存储。
      • 存储类型:伙伴云集群支持Emptydir和Local Storage两种存储类型。

        使用Emptydir模式普罗数据将存储在Pod中,请确保prometheus-server-0调度到的节点上的容器存储挂载容量满足所输入的容量大小。

        使用Local Storage将会在您的集群内创建monitoring命名空间(如果不存在),以及local-storage类型的PV及PVC,请保证您指定的节点上存在所输入的目录以及该目录满足所输入的容量大小。

      • 容量:创建PVC时指定的容量大小或者选择Pod存储时的存储最大限制值。

    关于插件的详细说明请参见kube-prometheus-stack插件

  6. 单击“确认接入”,自动返回至“容器洞察 > 集群总览”页面,集群的接入状态为“安装中”

    等待集群开启监控成功后,列表中将显示集群的CPU使用率、CPU分配率等指标,说明集群已经处于容器智能分析的守护中了。

    若集群开启监控失败,请参考常见问题处理。

相关文档