更新时间:2024-09-14 GMT+08:00

CES中Logstash集群支持的监控指标

云监控服务CES支持实时监控云搜索服务集群的核心指标,方便用户掌握集群的指标信息,以便及时处理集群的异常状况。

功能说明

本节定义了云搜索服务上报云监控服务的监控指标的命名空间,监控指标列表和维度定义。用户可以通过云监控服务提供管理控制台或API接口来检索云搜索服务产生的监控指标和告警信息。

  • 当Logstash集群的配置中心无管道列表的操作记录,则Logstash集群的监控记录将为空。
  • 当管道的“事件”数据动态变化时,监控数据也会同步变化;当管道任务在启动中、停止中或事件数据稳定时,监控数据则无变化。

命名空间

SYS.ES

CSS.CUSTOM

集群监控指标列表

  • 监控的指标ID指标名称指标含义以及取值范围参见表1
  • 监控的测量对象:CSS集群。本文介绍的是Logstash集群的监控指标列表。
  • 监控的监控周期(原始指标):1分钟

累计值:从节点启动时开始叠加数值,当节点重启后清零重新累计。

表1 云搜索服务支持的监控指标

指标ID

指标名称

指标含义

取值范围

max_jvm_heap_usage

最大JVM堆使用率

CSS集群中各个节点的JVM堆使用率的最大值。

单位:百分比

0-100%

max_jvm_young_gc_time

最大JVM Young GC耗时

CSS集群中各个节点的JVM Young GC耗时累计值的最大值。

单位:ms

≥ 0 ms

max_jvm_young_gc_count

最大JVM Young GC次数

CSS集群中各个节点的JVM Young GC次数累计值的最大值。

≥ 0

max_jvm_old_gc_time

最大JVM Old GC耗时

CSS集群中各个节点的JVM Old GC耗时累计值的最大值。

单位:ms

≥ 0 ms

max_jvm_old_gc_count

最大JVM Old GC次数

CSS集群中各个节点的JVM Old GC次数累计值的最大值。

≥ 0

max_cpu_usage

最大CPU利用率

CSS集群中各个节点的CPU利用率的最大值。

单位:百分比

0-100%

max_load_average

最大节点Load值

CSS集群中各个节点在操作系统中1分钟平均排队任务数的最大值。

≥ 0

avg_cpu_usage

平均CPU使用率

CSS集群中各节点CPU利用率的平均值。

单位:百分比

0-100%

avg_load_average

平均节点Load值

CSS集群中各节点在操作系统中1分钟平均排队任务数的平均值。

≥ 0

avg_jvm_heap_usage

平均JVM堆使用率

CSS集群中各节点JVM堆内存使用率的平均值。

单位:百分比

0-100%

avg_jvm_old_gc_count

JVM老年代平均GC次数

CSS集群中各个节点“老年代”垃圾回收的运行次数的累计值的平均值。

≥ 0

avg_jvm_old_gc_time

JVM老年代平均GC时间

CSS集群中各个节点执行“老年代”垃圾回收所花费的时间累计值的平均值。

单位:ms

≥ 0 ms

avg_jvm_young_gc_count

JVM年轻代平均GC次数

CSS集群中各个节点“年轻代”垃圾回收的运行次数的累计值的平均值。

≥ 0

avg_jvm_young_gc_time

JVM年轻代平均GC时间

CSS集群中各个节点执行“年轻代”垃圾回收所花费的时间累计值的平均值。

单位:ms

≥ 0 ms

sum_events_in

集群下所有节点经过input插件的数据总数

该指标用于统计所有节点经过input插件的数据总数。

≥ 0

sum_events_filtered

集群下所有节点经过filtere插件的数据总数

该指标用于统计所有节点经过过滤处理的数据总数。

≥ 0

sum_events_out

集群下所有节点经过out插件的数据总数

该指标用于统计所有节点经过out插件的数据总数。

≥ 0

节点监控指标列表

  • 监控的指标ID指标名称指标含义以及取值范围参见表2
  • 监控的测量对象:CSS集群 - 云服务节点
  • 监控的监控周期(原始指标):1分钟
表2 云搜索服务节点支持的监控指标

指标ID

指标名称

指标含义

取值范围

jvm_heap_usage

JVM堆使用率

节点JVM堆内存使用率。

单位:百分比

0-100%

cpu_usage

CPU利用率

CPU利用率。

单位:百分比

0-100%

load_average

节点Load值

操作系统中1分钟平均排队任务数。

≥ 0

jvm_old_gc_count

JVM老年代总GC次数

“老年代”垃圾回收的运行次数。

≥ 0

jvm_old_gc_time

JVM老年代总GC时间

执行“老年代”垃圾回收所花费的时间。

单位:ms

≥ 0 ms

jvm_young_gc_count

JVM年轻代总GC次数

“年轻代”垃圾回收的运行次数。

≥ 0

jvm_young_gc_time

JVM年轻代GC时间

执行“年轻代”垃圾回收所花费的时间。

单位:ms

≥ 0 ms

events_in

当前节点经过input插件的数据数

该指标用于统计当前节点经过input插件的数据数。

≥ 0

events_filtered

当前节点经过filtered插件的数据数

该指标用于统计当前节点过滤处理的数据数。

≥ 0

events_out

当前节点经过out插件的数据数

该指标用于统计当前节点经过out插件的数据数。

≥ 0

Logstash管道监控指标列表

  • 监控的指标ID指标名称指标含义以及取值范围参见表3
  • 监控的测量对象:CSS集群 - Logstash管道
  • 监控的监控周期(原始指标):1分钟
表3 Logstash管道的监控指标

指标ID

指标名称

指标含义

取值范围

logstash_pipeline_events_in

当前管道监控周期内经过input插件的数据数。

该指标用于统计当前管道监控周期内经过input插件的数据数。

≥ 0

logstash_pipeline_events_filtered

当前管道监控周期内经过filtered插件的数据数。

该指标用于统计当前管道监控周期内过滤处理的数据数。

≥ 0

logstash_pipeline_events_out

当前管道监控周期内经过out插件的数据数。

该指标用于统计当前管道监控周期内经过out插件的数据数。

≥ 0

维度

表4 维度说明

Key

Value

cluster_id

CSS集群

cluster_id,instance_id

CSS集群节点

cluster_id,instance_id,pipeline_name

CSS集群节点Logstash管道名称

cluster_id,pipeline_name

CSS集群Logstash管道名称