更新时间:2025-06-17 GMT+08:00

CES中OpenSearch集群支持的监控指标

云监控服务CES支持实时监控云搜索服务集群的核心指标,方便用户掌握集群的指标信息,以便及时处理集群的异常状况。

功能说明

云监控服务CES支持实时监控云搜索服务集群的核心指标,方便用户掌握集群的指标信息,以便及时处理集群的异常状况。本文定义了云搜索服务上报云监控服务的集群和节点监控指标的命名空间,监控指标列表和维度定义。用户可以通过云监控服务提供的管理控制台或API接口来检索云搜索服务产生的监控指标和告警信息。

命名空间

SYS.ES

集群监控指标列表

累计值:从节点启动时开始叠加数值,当节点重启后清零重新累计。

表1 云搜索服务支持的监控指标

指标ID

指标名称

指标含义

取值范围

单位

进制

测量对象(维度)

监控周期(原始指标)

status

集群健康状态

该指标用于统计测量监控对象的状态。

  • 0:集群是100%可用的。
  • 1:数据是完整的,部分副本缺失。高可用性在某种程度上弱化,存在风险,请及时关注集群情况。
  • 2:数据缺失,集群使用时将出现异常。
  • 3:没有获取到集群状态。

0、1、2、3

不涉及

不涉及

CSS集群

1分钟

disk_util

最大磁盘使用率

CSS集群中各个节点的磁盘使用率的最大值。

0~100

%

不涉及

CSS集群

1分钟

max_jvm_heap_usage

最大JVM堆使用率

CSS集群中各个节点的JVM堆使用率的最大值。

0~100

%

不涉及

CSS集群

1分钟

max_jvm_young_gc_time

最大JVM Young GC耗时

CSS集群中各个节点的JVM Young GC耗时累计值的最大值。

≥ 0

ms

不涉及

CSS集群

1分钟

max_jvm_young_gc_count

最大JVM Young GC次数

CSS集群中各个节点的JVM Young GC次数累计值的最大值。

≥ 0

Count

不涉及

CSS集群

1分钟

max_jvm_old_gc_time

最大JVM Old GC耗时

CSS集群中各个节点的JVM Old GC耗时累计值的最大值。

≥ 0

ms

不涉及

CSS集群

1分钟

max_jvm_old_gc_count

最大JVM Old GC次数

CSS集群中各个节点的JVM Old GC次数累计值的最大值。

≥ 0

Count

不涉及

CSS集群

1分钟

total_fs_size

文件系统总大小

CSS集群的文件系统总大小。

≥ 0

byte

1024

CSS集群

1分钟

free_fs_size

文件系统可用大小

CSS集群的文件系统可用大小。

≥ 0

byte

1024

CSS集群

1分钟

max_cpu_usage

最大CPU利用率

CSS集群中各个节点的CPU利用率的最大值。

0~100

%

不涉及

CSS集群

1分钟

max_cpu_time_of_jvm_process

最大JVM进程使用的CPU时间

CSS集群中各个节点JVM进程使用CPU的时间累计值的最大值。

≥ 0

ms

不涉及

CSS集群

1分钟

max_virtual_memory_size_of_jvm_process

最大JVM进程使用的虚拟内存大小

CSS集群中各个节点JVM进程可使用的虚拟内存大小的最大值。

≥ 0

byte

1024

CSS集群

1分钟

max_current_opened_http_count

最大当前打开的HTTP连接数

CSS集群中各个节点打开且尚未关闭的HTTP连接数的最大值。

≥ 0

Count

不涉及

CSS集群

1分钟

max_total_opened_http_count

最大全部打开的HTTP连接数

CSS集群中各个节点打开过的HTTP连接数累计值的最大值。

≥ 0

Count

不涉及

CSS集群

1分钟

indices_count

索引数量

CSS集群的索引数量。

≥ 0

Count

不涉及

CSS集群

1分钟

total_shards_count

分片数量

CSS集群的分片数量。

≥ 0

Count

不涉及

CSS集群

1分钟

primary_shards_count

主分片数量

CSS集群的主分片数量。

≥ 0

Count

不涉及

CSS集群

1分钟

docs_count

文档数量

CSS集群的文档数量。

≥ 0

Count

不涉及

CSS集群

1分钟

docs_deleted_count

被删除的文档数量

CSS集群的被删除的文档数量。

≥ 0

Count

不涉及

CSS集群

1分钟

nodes_count

节点数量

CSS集群的节点数量。

≥ 0

Count

不涉及

CSS集群

1分钟

data_nodes_count

数据节点数量

CSS集群的数据节点数量。

≥ 0

Count

不涉及

CSS集群

1分钟

coordinating_nodes_count

协调节点数量

CSS集群的协调节点数量。

≥ 0

Count

不涉及

CSS集群

1分钟

master_nodes_count

Master节点数量

CSS集群的Master节点数量。

≥ 0

Count

不涉及

CSS集群

1分钟

ingest_nodes_count

Client节点数量

CSS集群的Client节点数量。

≥ 0

Count

不涉及

CSS集群

1分钟

max_load_average

最大节点Load值

CSS集群中各个节点在操作系统中1分钟平均排队任务数的最大值。

≥ 0

Count

不涉及

CSS集群

1分钟

avg_cpu_usage

平均CPU使用率

CSS集群中各节点CPU利用率的平均值。

0~100

%

不涉及

CSS集群

1分钟

avg_load_average

平均节点Load值

CSS集群中各节点在操作系统中1分钟平均排队任务数的平均值。

≥ 0

Count

不涉及

CSS集群

1分钟

avg_jvm_heap_usage

平均JVM堆使用率

CSS集群中各节点JVM堆内存使用率的平均值。

0~100

%

不涉及

CSS集群

1分钟

max_open_file_descriptors

已打开的最大文件描述符数

CSS集群中各个节点已打开的文件描述符数的最大值。

≥ 0

Count

不涉及

CSS集群

1分钟

avg_open_file_descriptors

已打开的平均文件描述符数

CSS集群中各节点已打开的文件描述符数的平均值。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_max_file_descriptors

最大允许的文件描述符数

CSS集群中各节点最大允许的文件描述符数之和。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_open_file_descriptors

已打开的文件描述符数

CSS集群中各节点已打开的文件描述符数之和。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_write_queue

Write队列中总排队任务数

写入线程池中的排队任务数。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_search_queue

Search队列中总排队任务数

CSS集群中各节点在搜索线程池中的排队任务数之和。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_force_merge_queue

ForceMerge队列中总排队任务数

CSS集群中各节点在强制合并线程池中的排队任务数之和。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_write_rejected

Write队列中总的已拒绝任务数

CSS集群中各节点在写入线程池中的已拒绝任务数之和。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_search_rejected

Search队列中总的已拒绝任务数

CSS集群中各节点在搜索线程池中的已拒绝任务数之和。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_force_merge_rejected

Forcemerge队列中总的已拒绝任务数

CSS集群中各节点在强制合并线程池中的已拒绝任务数之和。

≥ 0

Count

不涉及

CSS集群

1分钟

max_thread_pool_search_queue

Search队列中最大排队任务数

CSS集群中各个节点在搜索线程池中的排队任务数的最大值。

≥ 0

Count

不涉及

CSS集群

1分钟

max_thread_pool_force_merge_queue

ForceMerge队列中最大排队任务数

CSS集群中各个节点在强制合并线程池中的排队任务数的最大值。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_write_threads

Write线程池总大小

CSS集群中各节点写入线程池的大小之和。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_search_threads

Search线程池总大小

CSS集群中各节点搜索线程池的大小之和。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_force_merge_threads

ForceMerge线程池总大小

CSS集群中各节点强制合并线程池的大小之和。

≥ 0

Count

不涉及

CSS集群

1分钟

avg_thread_pool_write_queue

Write队列中平均排队任务数

CSS集群中各节点在写入线程池中的排队任务数的平均值。

≥ 0

Count

不涉及

CSS集群

1分钟

avg_thread_pool_search_queue

Search队列中平均排队任务数

CSS集群中各节点在搜索线程池中的排队任务数的平均值。

≥ 0

Count

不涉及

CSS集群

1分钟

avg_thread_pool_force_merge_queue

ForceMerge队列中平均排队任务数

CSS集群中各节点在强制合并线程池中的排队任务数的平均值。

≥ 0

Count

不涉及

CSS集群

1分钟

avg_thread_pool_search_threads

Search线程池平均大小

CSS集群中各节点搜索线程池的大小的平均值。

≥ 0

Count

不涉及

CSS集群

1分钟

avg_thread_pool_write_threads

Write线程池平均大小

CSS集群中各节点写入线程池的大小的平均值。

≥ 0

Count

不涉及

CSS集群

1分钟

avg_thread_pool_force_merge_threads

ForceMerge线程池平均大小

CSS集群中各节点强制合并线程池的大小的平均值。

≥ 0

Count

不涉及

CSS集群

1分钟

avg_thread_pool_write_rejected

Write队列中平均已拒绝任务数

CSS集群中各节点写入线程池中的已拒绝任务数的平均值。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_flush_queue

Flush队列中总排队任务数

CSS集群中各个节点在Flush线程池中的排队任务数之和。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_flush_rejected

Flush队列中总的已拒绝任务数

CSS集群中各节点在Flush线程池中的已拒绝任务数之和。

≥ 0

Count

不涉及

CSS集群

1分钟

max_thread_pool_flush_queue

Flush队列中最大排队任务数

CSS集群中各个节点在Flush线程池中的排队任务数的最大值。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_flush_threads

Flush线程池总大小

CSS集群中各节点Flush线程池的大小之和。

≥ 0

Count

不涉及

CSS集群

1分钟

avg_thread_pool_flush_queue

Flush队列中平均排队任务数

CSS集群中各节点在Flush线程池中的排队任务数的平均值。

≥ 0

Count

不涉及

CSS集群

1分钟

avg_thread_pool_flush_threads

Flush线程池平均大小

CSS集群中各节点在Flush线程池中的排队任务数的平均值。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_generic_queue

Generic队列中总排队任务数

CSS集群中各个节点在Generic线程池中的排队任务数之和。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_generic_rejected

Generic队列中总的已拒绝任务数

CSS集群中各节点在Generic线程池中的已拒绝任务数之和。

≥ 0

Count

不涉及

CSS集群

1分钟

max_thread_pool_generic_queue

Generic队列中最大排队任务数

CSS集群中各个节点在Generic线程池中的排队任务数的最大值。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_generic_threads

Generic线程池总大小

CSS集群中各节点Generic线程池的大小之和。

≥ 0

Count

不涉及

CSS集群

1分钟

avg_thread_pool_generic_queue

Generic队列中平均排队任务数

CSS集群中各节点在Generic线程池中的排队任务数的平均值。

≥ 0

Count

不涉及

CSS集群

1分钟

avg_thread_pool_generic_threads

Generic线程池平均大小

CSS集群中各节点在Generic线程池中的排队任务数的平均值。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_management_queue

Management队列中总排队任务数

CSS集群中各个节点在Management线程池中的排队任务数之和。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_management_rejected

Management队列中总的已拒绝任务数

CSS集群中各节点在Management线程池中的已拒绝任务数之和。

≥ 0

Count

不涉及

CSS集群

1分钟

max_thread_pool_management_queue

Management队列中最大排队任务数

CSS集群中各个节点在Management线程池中的排队任务数的最大值。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_management_threads

Management线程池总大小

CSS集群中各节点Management线程池的大小之和。

≥ 0

Count

不涉及

CSS集群

1分钟

avg_thread_pool_management_queue

Management队列中平均排队任务数

CSS集群中各节点在Management线程池中的排队任务数的平均值。

≥ 0

Count

不涉及

CSS集群

1分钟

avg_thread_pool_management_threads

Management线程池平均大小

CSS集群中各节点在Management线程池中的排队任务数的平均值。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_refresh_queue

Refresh队列中总排队任务数

CSS集群中各个节点在Refresh线程池中的排队任务数之和。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_refresh_rejected

Refresh队列中总的已拒绝任务数

CSS集群中各节点在Refresh线程池中的已拒绝任务数之和。

≥ 0

Count

不涉及

CSS集群

1分钟

max_thread_pool_refresh_queue

Refresh队列中最大排队任务数

CSS集群中各个节点在Refresh线程池中的排队任务数的最大值。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_refresh_threads

Refresh线程池总大小

CSS集群中各节点Refresh线程池的大小之和。

≥ 0

Count

不涉及

CSS集群

1分钟

avg_thread_pool_refresh_queue

Refresh队列中平均排队任务数

CSS集群中各节点在Refresh线程池中的排队任务数的平均值。

≥ 0

Count

不涉及

CSS集群

1分钟

avg_thread_pool_refresh_threads

Refresh线程池平均大小

CSS集群中各节点在Refresh线程池中的排队任务数的平均值。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_obs_searcher_queue

OBS Searcher队列中总排队任务数

CSS集群中各个节点在OBS Searcher线程池中的排队任务数之和。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_obs_searcher_rejected

OBS Searcher队列中总的已拒绝任务数

CSS集群中各节点在OBS Searcher线程池中的已拒绝任务数之和。

≥ 0

Count

不涉及

CSS集群

1分钟

max_thread_pool_obs_searcher_queue

OBS Searcher队列中最大排队任务数

CSS集群中各个节点在OBS Searcher线程池中的排队任务数的最大值。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_obs_searcher_threads

OBS Searcher线程池总大小

CSS集群中各节点OBS Searcher线程池的大小之和。

≥ 0

Count

不涉及

CSS集群

1分钟

avg_thread_pool_obs_searcher_queue

OBS Searcher队列中平均排队任务数

CSS集群中各节点在OBS Searcher线程池中的排队任务数的平均值。

≥ 0

Count

不涉及

CSS集群

1分钟

avg_thread_pool_obs_searcher_threads

OBS Searcher线程池平均大小

CSS集群中各节点在OBS Searcher线程池中的排队任务数的平均值。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_obs_queue

OBS队列中总排队任务数

CSS集群中各个节点在OBS线程池中的排队任务数之和。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_obs_rejected

OBS队列中总的已拒绝任务数

CSS集群中各节点在OBS线程池中的已拒绝任务数之和。

≥ 0

Count

不涉及

CSS集群

1分钟

max_thread_pool_obs_queue

OBS队列中最大排队任务数

CSS集群中各个节点在OBS线程池中的排队任务数的最大值。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_obs_threads

OBS线程池总大小

CSS集群中各节点OBS线程池的大小之和。

≥ 0

Count

不涉及

CSS集群

1分钟

avg_thread_pool_obs_queue

OBS队列中平均排队任务数

CSS集群中各节点在OBS线程池中的排队任务数的平均值。

≥ 0

Count

不涉及

CSS集群

1分钟

avg_thread_pool_obs_threads

OBS线程池平均大小

CSS集群中各节点在OBS线程池中的排队任务数的平均值。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_obs_upload_queue

OBS Upload队列中总排队任务数

CSS集群中各个节点在OBS Upload线程池中的排队任务数之和。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_obs_upload_rejected

OBS Upload队列中总的已拒绝任务数

CSS集群中各节点在OBS Upload线程池中的已拒绝任务数之和。

≥ 0

Count

不涉及

CSS集群

1分钟

max_thread_pool_obs_upload_queue

OBS Upload队列中最大排队任务数

CSS集群中各个节点在OBS Upload线程池中的排队任务数的最大值。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_obs_upload_threads

OBS Upload线程池总大小

CSS集群中各节点OBS Upload线程池的大小之和。

≥ 0

Count

不涉及

CSS集群

1分钟

avg_thread_pool_obs_upload_queue

OBS Upload队列中平均排队任务数

CSS集群中各节点在OBS Upload线程池中的排队任务数的平均值。

≥ 0

Count

不涉及

CSS集群

1分钟

avg_thread_pool_obs_upload_threads

OBS Upload线程池平均大小

CSS集群中各节点在OBS Upload线程池中的排队任务数的平均值。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_obs_download_queue

OBS Download队列中总排队任务数

CSS集群中各个节点在OBS Download线程池中的排队任务数之和。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_obs_download_rejected

OBS Download队列中总的已拒绝任务数

CSS集群中各节点在OBS Download线程池中的已拒绝任务数之和。

≥ 0

Count

不涉及

CSS集群

1分钟

max_thread_pool_obs_download_queue

OBS Download队列中最大排队任务数

CSS集群中各个节点在OBS Download线程池中的排队任务数的最大值。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_thread_pool_obs_download_threads

OBS Download线程池总大小

CSS集群中各节点OBS Download线程池的大小之和。

≥ 0

Count

不涉及

CSS集群

1分钟

avg_thread_pool_obs_download_queue

OBS Download队列中平均排队任务数

CSS集群中各节点在OBS Download线程池中的排队任务数的平均值。

≥ 0

Count

不涉及

CSS集群

1分钟

avg_thread_pool_obs_download_threads

OBS Download线程池平均大小

CSS集群中各节点在OBS Download线程池中的排队任务数的平均值。

≥ 0

Count

不涉及

CSS集群

1分钟

min_free_fs_size

最小可用存储空间

CSS集群中各个节点可用存储空间的最小值。

≥ 0

byte

1024

CSS集群

1分钟

avg_jvm_old_gc_count

JVM老年代平均GC次数

CSS集群中各个节点“老年代”垃圾回收的运行次数的累计值的平均值。

≥ 0

Count

不涉及

CSS集群

1分钟

avg_jvm_old_gc_time

JVM老年代平均GC时间

CSS集群中各个节点执行“老年代”垃圾回收所花费的时间累计值的平均值。

≥ 0

ms

不涉及

CSS集群

1分钟

avg_jvm_young_gc_count

JVM年轻代平均GC次数

CSS集群中各个节点“年轻代”垃圾回收的运行次数的累计值的平均值。

≥ 0

Count

不涉及

CSS集群

1分钟

avg_jvm_young_gc_time

JVM年轻代平均GC时间

CSS集群中各个节点执行“年轻代”垃圾回收所花费的时间累计值的平均值。

≥ 0

ms

不涉及

CSS集群

1分钟

avg_max_file_descriptors

最大允许的文件描述符数-平均值

CSS集群中各节点最大允许的文件描述符数的平均值。

≥ 0

Count

不涉及

CSS集群

1分钟

avg_mem_free_in_bytes

平均可用内存空间

CSS集群中各节点未使用的内存容量的平均值。

≥ 0

byte

1024

CSS集群

1分钟

avg_mem_free_percent

平均可用内存比例

CSS集群中各节点未使用的内存比例的平均值。

0~100

%

不涉及

CSS集群

1分钟

avg_mem_used_in_bytes

平均已用内存空间

CSS集群中各节点已使用的内存容量的平均值。

≥ 0

byte

1024

CSS集群

1分钟

avg_mem_used_percent

平均已用内存比例

CSS集群中各节点已使用的内存比例的平均值。

0~100

%

不涉及

CSS集群

1分钟

max_mem_free_in_bytes

最大可用内存空间

CSS集群中各个节点未使用的内存容量的最大值。

≥ 0

byte

1024

CSS集群

1分钟

max_mem_free_percent

最大可用内存比例

CSS集群中各个节点未使用的内存比例的最大值。

0~100

%

不涉及

CSS集群

1分钟

max_mem_used_in_bytes

最大已用内存空间

CSS集群中各个节点已使用的内存容量的最大值。

≥ 0

byte

1024

CSS集群

1分钟

max_mem_used_percent

最大已用内存比例

CSS集群中各个节点已使用的内存比例的最大值。

0~100

%

不涉及

CSS集群

1分钟

sum_jvm_old_gc_count

JVM老年代总GC次数

CSS集群中各个节点“老年代”垃圾回收的运行次数的累计值之和。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_jvm_old_gc_time

JVM老年代总GC时间

CSS集群中各个节点执行“老年代”垃圾回收所花费的时间累计值之和。

≥ 0

ms

不涉及

CSS集群

1分钟

sum_jvm_young_gc_count

JVM年轻代总GC次数

CSS集群中各个节点“年轻代”垃圾回收的运行次数的累计值之和。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_jvm_young_gc_time

JVM年轻代总GC时间

CSS集群中各个节点执行“年轻代”垃圾回收所花费的时间累计值之和。

≥ 0

ms

不涉及

CSS集群

1分钟

sum_current_opened_http_count

当前已打开HTTP连接数

CSS集群中各个节点打开且尚未关闭的HTTP连接数之和。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_total_opened_http_count

历史已打开HTTP连接数

CSS集群中各个节点打开过的HTTP连接数累计值之和。

≥ 0

Count

不涉及

CSS集群

1分钟

IndexingLatency

平均索引延迟

分片完成索引操作所需的平均时间。

≥ 0

ms

不涉及

CSS集群

1分钟

IndexingRate

平均索引速率

入库TPS,集群每秒平均索引操作数。

≥ 0

Count

不涉及

CSS集群

1分钟

SearchLatency

平均查询延迟

分片完成搜索操作所需的平均时间。

≥ 0

ms

不涉及

CSS集群

1分钟

SearchRate

平均查询速率

查询QPS,集群每秒平均查询操作数。

≥ 0

Count

不涉及

CSS集群

1分钟

task_max_running_time

最大Task运行时长

该指标为集群运行的所有查询、写入Task中,运行时长最长的task耗时。

≥ 0

ms

不涉及

CSS集群

1分钟

number_of_pending_tasks

Pending Task排队任务数

CSS集群中待Master处理的task的排队任务数。

≥ 0

Count

不涉及

CSS集群

1分钟

sum_disk_read_requests_rate

磁盘读总IOPS

CSS集群所有节点的磁盘每秒读取数据的请求总次数。

≥ 0

request/s

不涉及

CSS集群

1分钟

sum_disk_write_requests_rate

磁盘写总IOPS

CSS集群所有节点的磁盘每秒写数据的请求总次数。

≥ 0

request/s

不涉及

CSS集群

1分钟

sum_disk_read_bytes_rate

磁盘读总带宽

CSS集群所有节点的磁盘每秒读出数据量。

≥ 0

Byte/s

1024

CSS集群

1分钟

sum_disk_write_bytes_rate

磁盘写总带宽

CSS集群所有节点的磁盘每秒写入数据量。

≥ 0

Byte/s

1024

CSS集群

1分钟

avg_vector_index_off_heap_used_in_bytes

平均向量索引堆外内存使用量

CSS集群各节点的向量索引查询加载的堆外内存使用量的平均值。

≥ 0

byte

1024

CSS集群

1分钟

avg_vector_index_off_heap_usage

平均向量索引堆外内存使用率

CSS集群各节点的向量索引查询加载的堆外内存使用率的平均值。

只有触发向量索引的查询才会触发对应向量索引的查询加载的堆外内存使用率。

0~100

%

不涉及

CSS集群

1分钟

max_vector_index_off_heap_used_in_bytes

最大向量索引堆外内存使用量

CSS集群各节点的向量索引查询加载的堆外内存使用量的最大值。

≥ 0

byte

1024

CSS集群

1分钟

max_vector_index_off_heap_usage

最大向量索引堆外内存使用率

CSS集群各节点的向量索引查询加载的堆外内存使用率的最大值。

只有触发向量索引的查询才会触发对应向量索引的查询加载的堆外内存使用率。

0~100

%

不涉及

CSS集群

1分钟

vector_index_circuit_breaker_status

向量索引熔断状态

向量索引的熔断状态。

  • 0:未熔断。
  • 1:熔断状态,请及时关注集群堆外内存使用率是否超阈值。

0、1

不涉及

不涉及

CSS集群

1分钟

cold_data_storage

冷数据存储量

CSS集群冷数据存储总量,是集群的索引冷冻后存放到OBS的数据总量,每小时统计一次。该OBS是CSS服务的OBS桶,用户无法在OBS控制台查看。

≥ 0

byte

1024

CSS集群

1分钟

number_of_index_creation_failures

索引创建失败次数

CSS集群中索引创建失败的次数。

≥ 0

Count

不涉及

CSS集群

1分钟

shard_doc_exceed_threshold_count

文档数超过阈值的分片数量

CSS集群中文档数超过阈值的分片数量。

≥ 0

Count

不涉及

CSS集群

1分钟

write_fail_alias_error

因别名异常导致的写入失败次数

在CSS集群中,因为索引别名异常而导致的写入失败的总次数。

OpenSearch集群仅1.3.6版本支持该监控指标。

≥ 0

Count

不涉及

CSS集群

1分钟

write_fail_documents_count_exceed

因文档数超限导致的写入失败次数

在CSS集群中,因为索引文档数超过限制而导致的写入失败的总次数。

OpenSearch集群仅1.3.6版本支持该监控指标。

≥ 0

Count

不涉及

CSS集群

1分钟

write_fail_fields_count_exceed

因字段数超限导致的写入失败次数

在CSS集群中,因为索引字段数超过限制而导致的写入失败的总次数。

OpenSearch集群仅1.3.6版本支持该监控指标。

≥ 0

Count

不涉及

CSS集群

1分钟

write_fail_shards_count_exceed

因集群分片总数超限导致的写入失败次数

在CSS集群中,因为集群分片总数超限而导致的写入失败的总次数。

OpenSearch集群仅1.3.6版本支持该监控指标。

≥ 0

Count

不涉及

CSS集群

1分钟

write_fail_index_blocks_write

因索引配置禁止写入导致的写入失败次数

在CSS集群中,因为索引配置禁止写入而导致的写入失败的总次数。

OpenSearch集群仅1.3.6版本支持该监控指标。

≥ 0

Count

不涉及

CSS集群

1分钟

write_fail_mapping_malformed

因字段类型不正确导致的写入失败次数

在CSS集群中,因为索引字段类型不正确导致的写入失败的总次数。

OpenSearch集群仅1.3.6版本支持该监控指标。

≥ 0

Count

不涉及

CSS集群

1分钟

index_storage

索引数据量

在CSS集群中,所有索引的数据量之和。

≥ 0

byte

1024

CSS集群

1分钟

backup_failed_task_count

备份失败任务个数

在CSS集群中,快照备份任务的失败个数。

≥ 0

Count

不涉及

CSS集群

1分钟

disk_total

磁盘总量

在CSS集群中,所有节点数据盘大小之和。

≥ 0

byte

1024

CSS集群

1分钟

number_of_unassigned_shards

未分配的分片数量

在CSS集群中,未分配的分片总数。

≥ 0

Count

不涉及

CSS集群

1分钟

节点监控指标列表

表2 云搜索服务节点支持的监控指标

指标ID

指标名称

指标含义

取值范围

单位

进制

测量对象(维度)

监控周期(原始指标)

jvm_heap_usage

JVM堆使用率

节点JVM堆内存使用率。

0~100

%

不涉及

CSS集群-云服务节点

1分钟

cpu_usage

CPU利用率

CPU利用率。

0~100

%

不涉及

CSS集群-云服务节点

1分钟

disk_util

最大磁盘使用率

节点的磁盘使用率。

0~100

%

不涉及

CSS集群-云服务节点

1分钟

load_average

节点Load值

操作系统中1分钟平均排队任务数。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

open_file_descriptors

已打开的文件描述符数

节点已打开的文件描述符数。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

max_file_descriptors

最大允许的文件描述符数

最大允许的文件描述符数。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_write_queue

Write队列中总排队任务数

写入线程池中的排队任务数。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_search_queue

Search队列中总排队任务数

搜索线程池中的排队任务数。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_force_merge_queue

ForceMerge队列中总排队任务数

强制合并线程池中的排队任务数。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_write_rejected

Write队列中总的已拒绝任务数

写入线程池中的已拒绝任务数。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_search_rejected

Search队列中总的已拒绝任务数

搜索线程池中的已拒绝任务数。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_force_merge_rejected

ForceMerge队列中总的已拒绝任务数

强制合并线程池中的已拒绝任务数。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_write_threads

Write线程池总大小

写入线程池的大小。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_search_threads

Search线程池总大小

搜索线程池的大小。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_force_merge_threads

ForceMerge线程池总大小

强制合并线程池的大小。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_flush_queue

Flush队列中总排队任务数

Flush线程池中的排队任务数。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_flush_rejected

Flush队列中总的已拒绝任务数

Flush线程池中的已拒绝任务数。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_flush_threads

Flush线程池总大小

Flush线程池的大小。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_generic_queue

Generic队列中总排队任务数

Generic线程池中的排队任务数。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_generic_rejected

Generic队列中总的已拒绝任务数

Generic线程池中的已拒绝任务数。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_generic_threads

Generic线程池总大小

Generic线程池的大小。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_management_queue

Management队列中总排队任务数

Management线程池中的排队任务数。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_management_rejected

Management队列中总的已拒绝任务数

Management线程池中的已拒绝任务数。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_management_threads

Management线程池总大小

Management线程池的大小。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_refresh_queue

Refresh队列中总排队任务数

Refresh线程池中的排队任务数。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_refresh_rejected

Refresh队列中总的已拒绝任务数

Refresh线程池中的已拒绝任务数。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_refresh_threads

Refresh线程池总大小

Refresh线程池的大小。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_obs_searcher_queue

OBS Searcher队列中总排队任务数

OBS Searcher线程池中的排队任务数。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_obs_searcher_rejected

OBS Searcher队列中总的已拒绝任务数

OBS Searcher线程池中的已拒绝任务数。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_obs_searcher_threads

OBS Searcher线程池总大小

OBS Searcher线程池的大小。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_obs_queue

OBS队列中总排队任务数

OBS线程池中的排队任务数。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_obs_rejected

OBS队列中总的已拒绝任务数

OBS线程池中的已拒绝任务数。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_obs_threads

OBS线程池总大小

OBS线程池的大小。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_obs_upload_queue

OBS Upload队列中总排队任务数

OBS Upload线程池中的排队任务数。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_obs_upload_rejected

OBS Upload队列中总的已拒绝任务数

OBS Upload线程池中的已拒绝任务数。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_obs_upload_threads

OBS Upload线程池总大小

OBS Upload线程池的大小。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_obs_download_queue

OBS Download队列中总排队任务数

OBS Download线程池中的排队任务数。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_obs_download_rejected

OBS Download队列中总的已拒绝任务数

OBS Download线程池中的已拒绝任务数。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

thread_pool_obs_download_threads

OBS Download线程池总大小

OBS Download线程池的大小。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

free_fs_size

文件系统可用大小

CSS集群的文件系统可用大小。

≥ 0

byte

1024

CSS集群-云服务节点

1分钟

total_fs_size

文件系统总大小

CSS集群的文件系统总大小。

≥ 0

byte

1024

CSS集群-云服务节点

1分钟

jvm_old_gc_count

JVM老年代总GC次数

“老年代”垃圾回收的运行次数。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

jvm_old_gc_time

JVM老年代总GC时间

执行“老年代”垃圾回收所花费的时间。

≥ 0

ms

不涉及

CSS集群-云服务节点

1分钟

jvm_young_gc_count

JVM年轻代总GC次数

“年轻代”垃圾回收的运行次数。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

jvm_young_gc_time

JVM年轻代GC时间

执行“年轻代”垃圾回收所花费的时间。

≥ 0

ms

不涉及

CSS集群-云服务节点

1分钟

mem_free_in_bytes

可用内存空间

节点未使用的内存容量。

≥ 0

byte

1024

CSS集群-云服务节点

1分钟

mem_free_percent

可用内存比例

节点未使用的内存比例。

0~100

%

不涉及

CSS集群-云服务节点

1分钟

mem_used_in_bytes

已用内存空间

节点已使用的内存容量。

≥ 0

byte

1024

CSS集群-云服务节点

1分钟

current_opened_http_count

当前已打开HTTP连接数

节点当前打开的HTTP连接数。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

total_opened_http_count

全部打开的HTTP连接数

节点全部打开的HTTP连接数。

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

disk_read_requests_rate

磁盘读IOPS

CSS集群节点的磁盘每秒读取数据的请求总次数。

≥ 0

request/s

不涉及

CSS集群-云服务节点

1分钟

disk_write_requests_rate

磁盘写IOPS

CSS集群节点的磁盘每秒写数据的请求总次数。

≥ 0

request/s

不涉及

CSS集群-云服务节点

1分钟

disk_read_bytes_rate

磁盘读带宽

CSS集群节点的磁盘每秒读出数据量。

≥ 0

Byte/s

1024

CSS集群-云服务节点

1分钟

disk_write_bytes_rate

磁盘写带宽

CSS集群节点的磁盘每秒写入数据量。

≥ 0

Byte/s

1024

CSS集群-云服务节点

1分钟

shards_count

分片数量

CSS集群节点的分片数量

≥ 0

Count

不涉及

CSS集群-云服务节点

1分钟

vector_index_off_heap_used_in_bytes

向量索引堆外内存使用量

CSS集群节点向量索引查询加载的堆外内存使用量。

≥ 0

byte

1024

CSS集群-云服务节点

1分钟

vector_index_off_heap_usage

向量索引堆外内存使用率

CSS集群节点向量索引查询加载的堆外内存使用率。

0~100

%

不涉及

CSS集群-云服务节点

1分钟

维度

表3 维度说明

Key

Value

cluster_id

CSS集群ID

cluster_id,instance_id

CSS集群-云服务节点ID