更新时间:2024-06-28 GMT+08:00

MongoDB Exporter接入

操作场景

使用MongoDB过程中需要对MongoDB运行状态进行监控,以便了解MongoDB服务是否运行正常,排查MongoDB故障问题原因。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控MongoDB运行状态。本文介绍如何部署Exporter以及实现MongoDB Exporter告警接入等操作。

为了方便安装管理Exporter,推荐使用CCE进行统一管理。

前提条件

MongoDB Exporter部署

  1. 登录CCE控制台。
  2. 单击已接入的CCE集群名称,进入该集群的管理页面。
  3. 执行以下操作完成Exporter部署。

    1. 配置密钥。

      在左侧导航栏中选择“配置与密钥”,在页面右上角单击“YAML创建”。YAML配置示例如下:

      apiVersion: v1
      kind: Secret
      metadata:
          name: mongodb-secret-test
          namespace: default
      type: Opaque
      stringData:
          datasource: "mongodb://{user}:{passwd}@{host1}:{port1},{host2}:{port2},{host3}:{port3}/admin"  # 对应连接URI
      • 密码已按照Opaque加密。
      • 配置密钥的详细操作参见创建密钥
    2. 部署MongoDB Exporter。
      在左侧导航栏中选择“工作负载”,在右上角单击“创建负载”,选择“负载类型”为无状态工作负载Deployment,选择需要的命名空间部署MongoDB Exporter。如果以YAML的方式部署Exporter,YAML配置示例如下:
      apiVersion: apps/v1
      kind: Deployment
      metadata:
        labels:
          k8s-app: mongodb-exporter # 根据业务需要调整,建议加上MongoDB实例的信息
        name: mongodb-exporter # 根据业务需要调整,建议加上MongoDB实例的信息
        namespace: default #需要和CCE集群中安装的MongoDB命名空间一致
      spec:
        replicas: 1
        selector:
          matchLabels:
            k8s-app: mongodb-exporter # 根据业务需要调整,建议加上MongoDB实例的信息
        template:
          metadata:
            labels:
              k8s-app: mongodb-exporter # 根据业务需要调整,建议加上MongoDB实例的信息
          spec:
            containers:
              - args:
                  - --collect.database       # 启用数据库指标采集
                  - --collect.collection     # 启用集合指标采集
                  - --collect.topmetrics     # 启用数据库表头指标信息采集
                  - --collect.indexusage     # 启用索引使用统计信息采集
                  - --collect.connpoolstats  # 启动MongoDB连接池统计信息采集
                env:
                  - name: MONGODB_URI
                    valueFrom:
                      secretKeyRef:
                        name: mongodb-secret-test
                        key: datasource
                image: swr.cn-north-4.myhuaweicloud.com/mall-swarm-demo/mongodb-exporter:0.10.0
                imagePullPolicy: IfNotPresent
                name: mongodb-exporter
                ports:
                  - containerPort: 9216
                    name: metric-port  # 这个名称在配置抓取任务的时候需要
                securityContext:
                  privileged: false
                terminationMessagePath: /dev/termination-log
                terminationMessagePolicy: File
            dnsPolicy: ClusterFirst
            imagePullSecrets:
              - name: default-secret
            restartPolicy: Always
            schedulerName: default-scheduler
            securityContext: { }
            terminationGracePeriodSeconds: 30
      ---
      apiVersion: v1
      kind: Service
      metadata:
        name: mongodb-exporter
      spec:
        type: NodePort
        selector:
          k8s-app: mongodb-exporter
        ports:
          - protocol: TCP
            nodePort: 30003
            port: 9216
            targetPort: 9216

      更多Exporter详细参数介绍请参见mongodb_exporter

    1. 验证MongoDB Exporter是否部署成功。
      1. 在工作负载列表中“无状态负载”页签下,单击3.b创建的无状态工作负载的名称,在实例列表中单击操作列下的“更多 > 日志”,可以查看到Exporter成功启动并暴露访问地址。
        图1 查看日志
      1. 验证。有以下三种方法进行验证:
        • 登录集群节点执行如下任意一种命令:
          curl http://{集群IP}:9216/metrics
          curl http://{集群任意节点私有IP}:30003/metrics 
        • 访问地址:http://{集群任意节点的公网IP}:30003/metrics。
          图2 访问地址
        • 在实例列表中单击操作列下的“更多 > 远程登录”,执行如下命令。
          curl http://localhost:9216/metric

采集CCE集群的业务数据

通过新增PodMonitor方式为应用配置可观测监控Prometheus版的采集规则,监控部署在CCE集群内的应用的业务数据。

如下示例中指标采集的周期是30秒,所以等待大概30秒后才能在AOM的界面上查看到上报的指标。

apiVersion: monitoring.coreos.com/v1
kind: PodMonitor
metadata:
  name: mongodb-exporter
  namespace: default
spec:
  namespaceSelector:
    matchNames:
      - default # exporter所在的命名空间
  podMetricsEndpoints:
  - interval: 30s
    path: /metrics
    port: metric-port
  selector:
    matchLabels:
      k8s-app: mongodb-exporter

验证指标上报到AOM

  1. 登录AOM 2.0控制台。
  2. 在左侧菜单栏中选择“Prometheus监控 > 实例列表”。
  3. 单击接入了该CCE集群的“prometheus for CCE”实例名称,进入实例详情页面。
  4. 在“指标管理”页面的“指标”页签下,选择集群。
  5. 选择job:{namespace}/MongoDB-exporter,可以查询到mongodb开头的自定义指标。

在AOM上配置仪表盘和告警

通过仪表盘功能可视化监控CCE集群数据,通过告警规则功能,在集群发生故障时能够及时发现并预警。

  • 配置仪表盘图表
    1. 登录AOM 2.0控制台。
    2. 在左侧菜单栏中选择“仪表盘”,单击“创建仪表盘”新建一个仪表盘,详情可参见创建仪表盘
    3. 在仪表盘页面选择实例类型为“Prometheus for CCE”的实例并单击“添加图表”,详情请参见添加图表至仪表
  • 配置告警
    1. 登录AOM 2.0控制台。
    2. 在左侧菜单栏中选择“告警管理 > 告警规则”。
    3. 在“指标或事件”页签下单击“创建”配置告警详情请参见创建指标告警规则