更新时间:2023-06-20 GMT+08:00

支持的监控指标

功能说明

本节定义了云搜索服务上报云监控服务的监控指标的命名空间,监控指标列表和维度定义。用户可以通过云监控服务提供管理控制台或API接口来检索云搜索服务产生的监控指标和告警信息。

命名空间

SYS.ES

监控指标

  • 监控的指标ID指标名称指标含义以及取值范围参见表1
  • 监控的测量对象:CSS集群
  • 监控的监控周期(原始指标):1分钟

累计值:从节点启动时开始叠加数值,当节点重启后清零重新累计。

表1 云搜索服务支持的监控指标

指标ID

指标名称

指标含义

取值范围

status

集群健康状态

该指标用于统计测量监控对象的状态。

0,1,2,3

0:集群是100%可用的。

1:数据是完整的,部分副本缺失。高可用性在某种程度上弱化,存在风险,请及时关注集群情况。

2:数据缺失,集群使用时将出现异常。

3:没有获取到集群状态。

disk_util

磁盘使用率

该指标用于统计测量对象的磁盘使用率。

单位:百分比

0-100%

max_jvm_heap_usage

最大JVM堆使用率

CSS集群中各个节点的JVM堆使用率的最大值。

单位:百分比。

0-100%

max_jvm_young_gc_time

最大JVM Young GC耗时

CSS集群中各个节点的JVM Young GC耗时累计值的最大值。

单位:ms

≥ 0 ms

max_jvm_young_gc_count

最大JVM Young GC次数

CSS集群中各个节点的JVM Young GC次数累计值的最大值。

≥ 0

max_jvm_old_gc_time

最大JVM Old GC耗时

CSS集群中各个节点的JVM Old GC耗时累计值的最大值。

单位:ms

≥ 0 ms

max_jvm_old_gc_count

最大JVM Old GC次数

CSS集群中各个节点的JVM Old GC次数累计值的最大值。

≥ 0

total_fs_size

文件系统总大小

CSS集群的文件系统总大小。

单位:byte

≥ 0 bytes

free_fs_size

文件系统可用大小

CSS集群的文件系统可用大小。

单位:byte

≥ 0 bytes

max_cpu_usage

最大CPU利用率

CSS集群中各个节点的CPU利用率的最大值。

单位:百分比

0-100%

max_cpu_time_of_jvm_process

最大JVM进程使用的CPU时间

CSS集群中各个节点JVM进程使用CPU的时间累计值的最大值。

单位:ms

≥ 0 ms

max_virtual_memory_size_of_jvm_process

最大JVM进程使用的虚拟内存大小

CSS集群中各个节点JVM进程可使用的虚拟内存大小的最大值。

单位:byte

≥ 0 bytes

max_current_opened_http_count

最大当前打开的Http连接数

CSS集群中各个节点打开且尚未关闭的Http连接数的最大值。

≥ 0

max_total_opened_http_count

最大全部打开的Http连接数

CSS集群中各个节点打开过的Http连接数累计值的最大值。

≥ 0

indices_count

索引数量

CSS集群的索引数量。

≥ 0

total_shards_count

分片数量

CSS集群的分片数量。

≥ 0

primary_shards_count

主分片数量

CSS集群的主分片数量。

≥ 0

docs_count

文档数量

CSS集群的文档数量。

≥ 0

docs_deleted_count

被删除的文档数量

CSS集群的被删除的文档数量。

≥ 0

nodes_count

节点数量

CSS集群的节点数量。

≥ 0

data_nodes_count

数据节点数量

CSS集群的数据节点数量。

≥ 0

coordinating_nodes_count

协调节点数量

CSS集群的协调节点数量。

≥ 0

master_nodes_count

Master节点数量

CSS集群的Master节点数量。

≥ 0

ingest_nodes_count

Client节点数量

CSS集群的Client节点数量。

≥ 0

max_load_average

最大节点Load值

CSS集群中各个节点在操作系统中1分钟平均排队任务数的最大值。

≥ 0

avg_cpu_usage

平均CPU使用率

CSS集群中各节点CPU利用率的平均值。

单位:百分比

0-100%

avg_load_average

平均节点Load值

CSS集群中各节点在操作系统中1分钟平均排队任务数的平均值。

≥ 0

avg_jvm_heap_usage

平均JVM堆使用率

CSS集群中各节点JVM堆内存使用率的平均值。

单位:百分比

0-100%

max_open_file_descriptors

已打开的最大文件描述符数

CSS集群中各个节点已打开的文件描述符数的最大值。

≥ 0

avg_open_file_descriptors

已打开的平均文件描述符数

CSS集群中各节点已打开的文件描述符数的平均值。

≥ 0

sum_max_file_descriptors

最大允许的文件描述符数

CSS集群中各节点最大允许的文件描述符数之和。

≥ 0

sum_open_file_descriptors

已打开的文件描述符数

CSS集群中各节点已打开的文件描述符数之和。

≥ 0

sum_thread_pool_write_queue

Write队列中总排队任务数

写入线程池中的排队任务数。

≥ 0

sum_thread_pool_search_queue

Search队列中总排队任务数

CSS集群中各节点在搜索线程池中的排队任务数之和。

≥ 0

sum_thread_pool_force_merge_queue

ForceMerge队列中总排队任务数

CSS集群中各节点在强制合并线程池中的排队任务数之和。

≥ 0

sum_thread_pool_write_rejected

Write队列中总的已拒绝任务数

CSS集群中各节点在写入线程池中的已拒绝任务数之和。

≥ 0

sum_thread_pool_search_rejected

Search队列中总的已拒绝任务数

CSS集群中各节点在搜索线程池中的已拒绝任务数之和。

≥ 0

sum_thread_pool_force_merge_rejected

Forcemerge队列中总的已拒绝任务数

CSS集群中各节点在强制合并线程池中的已拒绝任务数之和。

≥ 0

max_thread_pool_search_queue

Search队列中最大排队任务数

CSS集群中各个节点在搜索线程池中的排队任务数的最大值。

≥ 0

max_thread_pool_force_merge_queue

ForceMerge队列中最大排队任务数

CSS集群中各个节点在强制合并线程池中的排队任务数的最大值。

≥ 0

sum_thread_pool_write_threads

Write线程池总大小

CSS集群中各节点写入线程池的大小之和。

≥ 0

sum_thread_pool_search_threads

Search线程池总大小

CSS集群中各节点搜索线程池的大小之和。

≥ 0

sum_thread_pool_force_merge_threads

ForceMerge线程池总大小

CSS集群中各节点强制合并线程池的大小之和。

≥ 0

avg_thread_pool_write_queue

Write队列中平均排队任务数

CSS集群中各节点在写入线程池中的排队任务数的平均值。

≥ 0

avg_thread_pool_search_queue

Search队列中平均排队任务数

CSS集群中各节点在搜索线程池中的排队任务数的平均值。

≥ 0

avg_thread_pool_force_merge_queue

ForceMerge队列中平均排队任务数

CSS集群中各节点在强制合并线程池中的排队任务数的平均值。

≥ 0

avg_thread_pool_search_threads

Search线程池平均大小

CSS集群中各节点搜索线程池的大小的平均值。

≥ 0

avg_thread_pool_write_threads

Write线程池平均大小

CSS集群中各节点写入线程池的大小的平均值。

≥ 0

avg_thread_pool_force_merge_threads

ForceMerge线程池平均大小

CSS集群中各节点强制合并线程池的大小的平均值。

≥ 0

avg_thread_pool_write_rejected

Write队列中平均已拒绝任务数

CSS集群中各节点写入线程池中的已拒绝任务数的平均值。

≥ 0

min_free_fs_size

最小可用存储空间

CSS集群中各个节点可用存储空间的最小值。

单位:byte

≥ 0 bytes

avg_jvm_old_gc_count

JVM老年代平均GC次数

CSS集群中各个节点“老年代”垃圾回收的运行次数的累计值的平均值。

≥ 0

avg_jvm_old_gc_time

JVM老年代平均GC时间

CSS集群中各个节点执行“老年代”垃圾回收所花费的时间累计值的平均值。

单位:ms

≥ 0 ms

avg_jvm_young_gc_count

JVM年轻代平均GC次数

CSS集群中各个节点“年轻代”垃圾回收的运行次数的累计值的平均值。

≥ 0

avg_jvm_young_gc_time

JVM年轻代平均GC时间

CSS集群中各个节点执行“年轻代”垃圾回收所花费的时间累计值的平均值。

单位:ms

≥ 0 ms

avg_max_file_descriptors

最大允许的文件描述符数-平均值

CSS集群中各节点最大允许的文件描述符数的平均值。

≥ 0

avg_mem_free_in_bytes

平均可用内存空间

CSS集群中各节点未使用的内存容量的平均值。

单位:byte

≥ 0 bytes

avg_mem_free_percent

平均可用内存比例

CSS集群中各节点未使用的内存比例的平均值。

单位:百分比

0-100%

avg_mem_used_in_bytes

平均已用内存空间

CSS集群中各节点已使用的内存容量的平均值。

单位:byte

≥ 0 bytes

avg_mem_used_percent

平均已用内存比例

CSS集群中各节点已使用的内存比例的平均值。

单位:百分比

0-100%

max_mem_free_in_bytes

最大可用内存空间

CSS集群中各个节点未使用的内存容量的最大值。

单位:byte

≥ 0 bytes

max_mem_free_percent

最大可用内存比例

CSS集群中各个节点未使用的内存比例的最大值。

单位:百分比

0-100%

max_mem_used_in_bytes

最大已用内存空间

CSS集群中各个节点已使用的内存容量的最大值。

单位:byte

≥ 0 bytes

max_mem_used_percent

最大已用内存比例

CSS集群中各个节点已使用的内存比例的最大值。

单位:百分比

0-100%

sum_jvm_old_gc_count

JVM老年代总GC次数

CSS集群中各个节点“老年代”垃圾回收的运行次数的累计值之和。

≥ 0

sum_jvm_old_gc_time

JVM老年代总GC时间

CSS集群中各个节点执行“老年代”垃圾回收所花费的时间累计值之和。

单位:ms

≥ 0ms

sum_jvm_young_gc_count

JVM年轻代总GC次数

CSS集群中各个节点“年轻代”垃圾回收的运行次数的累计值之和。

≥ 0

sum_jvm_young_gc_time

JVM年轻代总GC时间

CSS集群中各个节点执行“年轻代”垃圾回收所花费的时间累计值之和。

单位:ms

≥ 0 ms

sum_current_opened_http_count

当前已打开http连接数

CSS集群中各个节点打开且尚未关闭的Http连接数之和。

≥ 0

sum_total_opened_http_count

历史已打开http连接数

CSS集群中各个节点打开过的Http连接数累计值之和。

≥ 0

IndexingLatency

平均索引延迟

分片完成索引操作所需的平均时间。

单位:ms

≥ 0 ms

IndexingRate

平均索引速率

入库TPS,集群每秒平均索引操作数。

单位:s。

≥ 0s

SearchLatency

平均查询延迟

分片完成搜索操作所需的平均时间。

单位:ms。

≥ 0 bytes

SearchRate

平均查询速率

查询QPS,集群每秒平均查询操作数。

单位:s

≥ 0/s

维度

表2 维度说明

Key

Value

cluster_id

CSS集群