支持的监控指标
功能说明
本节定义了云搜索服务上报云监控服务的监控指标的命名空间,监控指标列表和维度定义。用户可以通过云监控服务提供管理控制台或API接口来检索云搜索服务产生的监控指标和告警信息。
命名空间
SYS.ES
监控指标
- 监控的指标ID、指标名称、指标含义以及取值范围参见表1。
- 监控的测量对象:CSS集群
- 监控的监控周期(原始指标):1分钟
累计值:从节点启动时开始叠加数值,当节点重启后清零重新累计。
指标ID |
指标名称 |
指标含义 |
取值范围 |
---|---|---|---|
status |
集群健康状态 |
该指标用于统计测量监控对象的状态。 |
0,1,2,3 0:集群是100%可用的。 1:数据是完整的,部分副本缺失。高可用性在某种程度上弱化,存在风险,请及时关注集群情况。 2:数据缺失,集群使用时将出现异常。 3:没有获取到集群状态。 |
disk_util |
磁盘使用率 |
该指标用于统计测量对象的磁盘使用率。 单位:百分比 |
0-100% |
max_jvm_heap_usage |
最大JVM堆使用率 |
CSS集群中各个节点的JVM堆使用率的最大值。 单位:百分比。 |
0-100% |
max_jvm_young_gc_time |
最大JVM Young GC耗时 |
CSS集群中各个节点的JVM Young GC耗时累计值的最大值。 单位:ms |
≥ 0 ms |
max_jvm_young_gc_count |
最大JVM Young GC次数 |
CSS集群中各个节点的JVM Young GC次数累计值的最大值。 |
≥ 0 |
max_jvm_old_gc_time |
最大JVM Old GC耗时 |
CSS集群中各个节点的JVM Old GC耗时累计值的最大值。 单位:ms |
≥ 0 ms |
max_jvm_old_gc_count |
最大JVM Old GC次数 |
CSS集群中各个节点的JVM Old GC次数累计值的最大值。 |
≥ 0 |
total_fs_size |
文件系统总大小 |
CSS集群的文件系统总大小。 单位:byte |
≥ 0 bytes |
free_fs_size |
文件系统可用大小 |
CSS集群的文件系统可用大小。 单位:byte |
≥ 0 bytes |
max_cpu_usage |
最大CPU利用率 |
CSS集群中各个节点的CPU利用率的最大值。 单位:百分比 |
0-100% |
max_cpu_time_of_jvm_process |
最大JVM进程使用的CPU时间 |
CSS集群中各个节点JVM进程使用CPU的时间累计值的最大值。 单位:ms |
≥ 0 ms |
max_virtual_memory_size_of_jvm_process |
最大JVM进程使用的虚拟内存大小 |
CSS集群中各个节点JVM进程可使用的虚拟内存大小的最大值。 单位:byte |
≥ 0 bytes |
max_current_opened_http_count |
最大当前打开的Http连接数 |
CSS集群中各个节点打开且尚未关闭的Http连接数的最大值。 |
≥ 0 |
max_total_opened_http_count |
最大全部打开的Http连接数 |
CSS集群中各个节点打开过的Http连接数累计值的最大值。 |
≥ 0 |
indices_count |
索引数量 |
CSS集群的索引数量。 |
≥ 0 |
total_shards_count |
分片数量 |
CSS集群的分片数量。 |
≥ 0 |
primary_shards_count |
主分片数量 |
CSS集群的主分片数量。 |
≥ 0 |
docs_count |
文档数量 |
CSS集群的文档数量。 |
≥ 0 |
docs_deleted_count |
被删除的文档数量 |
CSS集群的被删除的文档数量。 |
≥ 0 |
nodes_count |
节点数量 |
CSS集群的节点数量。 |
≥ 0 |
data_nodes_count |
数据节点数量 |
CSS集群的数据节点数量。 |
≥ 0 |
coordinating_nodes_count |
协调节点数量 |
CSS集群的协调节点数量。 |
≥ 0 |
master_nodes_count |
Master节点数量 |
CSS集群的Master节点数量。 |
≥ 0 |
ingest_nodes_count |
Client节点数量 |
CSS集群的Client节点数量。 |
≥ 0 |
max_load_average |
最大节点Load值 |
CSS集群中各个节点在操作系统中1分钟平均排队任务数的最大值。 |
≥ 0 |
avg_cpu_usage |
平均CPU使用率 |
CSS集群中各节点CPU利用率的平均值。 单位:百分比 |
0-100% |
avg_load_average |
平均节点Load值 |
CSS集群中各节点在操作系统中1分钟平均排队任务数的平均值。 |
≥ 0 |
avg_jvm_heap_usage |
平均JVM堆使用率 |
CSS集群中各节点JVM堆内存使用率的平均值。 单位:百分比 |
0-100% |
max_open_file_descriptors |
已打开的最大文件描述符数 |
CSS集群中各个节点已打开的文件描述符数的最大值。 |
≥ 0 |
avg_open_file_descriptors |
已打开的平均文件描述符数 |
CSS集群中各节点已打开的文件描述符数的平均值。 |
≥ 0 |
sum_max_file_descriptors |
最大允许的文件描述符数 |
CSS集群中各节点最大允许的文件描述符数之和。 |
≥ 0 |
sum_open_file_descriptors |
已打开的文件描述符数 |
CSS集群中各节点已打开的文件描述符数之和。 |
≥ 0 |
sum_thread_pool_write_queue |
Write队列中总排队任务数 |
写入线程池中的排队任务数。 |
≥ 0 |
sum_thread_pool_search_queue |
Search队列中总排队任务数 |
CSS集群中各节点在搜索线程池中的排队任务数之和。 |
≥ 0 |
sum_thread_pool_force_merge_queue |
ForceMerge队列中总排队任务数 |
CSS集群中各节点在强制合并线程池中的排队任务数之和。 |
≥ 0 |
sum_thread_pool_write_rejected |
Write队列中总的已拒绝任务数 |
CSS集群中各节点在写入线程池中的已拒绝任务数之和。 |
≥ 0 |
sum_thread_pool_search_rejected |
Search队列中总的已拒绝任务数 |
CSS集群中各节点在搜索线程池中的已拒绝任务数之和。 |
≥ 0 |
sum_thread_pool_force_merge_rejected |
Forcemerge队列中总的已拒绝任务数 |
CSS集群中各节点在强制合并线程池中的已拒绝任务数之和。 |
≥ 0 |
max_thread_pool_search_queue |
Search队列中最大排队任务数 |
CSS集群中各个节点在搜索线程池中的排队任务数的最大值。 |
≥ 0 |
max_thread_pool_force_merge_queue |
ForceMerge队列中最大排队任务数 |
CSS集群中各个节点在强制合并线程池中的排队任务数的最大值。 |
≥ 0 |
sum_thread_pool_write_threads |
Write线程池总大小 |
CSS集群中各节点写入线程池的大小之和。 |
≥ 0 |
sum_thread_pool_search_threads |
Search线程池总大小 |
CSS集群中各节点搜索线程池的大小之和。 |
≥ 0 |
sum_thread_pool_force_merge_threads |
ForceMerge线程池总大小 |
CSS集群中各节点强制合并线程池的大小之和。 |
≥ 0 |
avg_thread_pool_write_queue |
Write队列中平均排队任务数 |
CSS集群中各节点在写入线程池中的排队任务数的平均值。 |
≥ 0 |
avg_thread_pool_search_queue |
Search队列中平均排队任务数 |
CSS集群中各节点在搜索线程池中的排队任务数的平均值。 |
≥ 0 |
avg_thread_pool_force_merge_queue |
ForceMerge队列中平均排队任务数 |
CSS集群中各节点在强制合并线程池中的排队任务数的平均值。 |
≥ 0 |
avg_thread_pool_search_threads |
Search线程池平均大小 |
CSS集群中各节点搜索线程池的大小的平均值。 |
≥ 0 |
avg_thread_pool_write_threads |
Write线程池平均大小 |
CSS集群中各节点写入线程池的大小的平均值。 |
≥ 0 |
avg_thread_pool_force_merge_threads |
ForceMerge线程池平均大小 |
CSS集群中各节点强制合并线程池的大小的平均值。 |
≥ 0 |
avg_thread_pool_write_rejected |
Write队列中平均已拒绝任务数 |
CSS集群中各节点写入线程池中的已拒绝任务数的平均值。 |
≥ 0 |
min_free_fs_size |
最小可用存储空间 |
CSS集群中各个节点可用存储空间的最小值。 单位:byte |
≥ 0 bytes |
avg_jvm_old_gc_count |
JVM老年代平均GC次数 |
CSS集群中各个节点“老年代”垃圾回收的运行次数的累计值的平均值。 |
≥ 0 |
avg_jvm_old_gc_time |
JVM老年代平均GC时间 |
CSS集群中各个节点执行“老年代”垃圾回收所花费的时间累计值的平均值。 单位:ms |
≥ 0 ms |
avg_jvm_young_gc_count |
JVM年轻代平均GC次数 |
CSS集群中各个节点“年轻代”垃圾回收的运行次数的累计值的平均值。 |
≥ 0 |
avg_jvm_young_gc_time |
JVM年轻代平均GC时间 |
CSS集群中各个节点执行“年轻代”垃圾回收所花费的时间累计值的平均值。 单位:ms |
≥ 0 ms |
avg_max_file_descriptors |
最大允许的文件描述符数-平均值 |
CSS集群中各节点最大允许的文件描述符数的平均值。 |
≥ 0 |
avg_mem_free_in_bytes |
平均可用内存空间 |
CSS集群中各节点未使用的内存容量的平均值。 单位:byte |
≥ 0 bytes |
avg_mem_free_percent |
平均可用内存比例 |
CSS集群中各节点未使用的内存比例的平均值。 单位:百分比 |
0-100% |
avg_mem_used_in_bytes |
平均已用内存空间 |
CSS集群中各节点已使用的内存容量的平均值。 单位:byte |
≥ 0 bytes |
avg_mem_used_percent |
平均已用内存比例 |
CSS集群中各节点已使用的内存比例的平均值。 单位:百分比 |
0-100% |
max_mem_free_in_bytes |
最大可用内存空间 |
CSS集群中各个节点未使用的内存容量的最大值。 单位:byte |
≥ 0 bytes |
max_mem_free_percent |
最大可用内存比例 |
CSS集群中各个节点未使用的内存比例的最大值。 单位:百分比 |
0-100% |
max_mem_used_in_bytes |
最大已用内存空间 |
CSS集群中各个节点已使用的内存容量的最大值。 单位:byte |
≥ 0 bytes |
max_mem_used_percent |
最大已用内存比例 |
CSS集群中各个节点已使用的内存比例的最大值。 单位:百分比 |
0-100% |
sum_jvm_old_gc_count |
JVM老年代总GC次数 |
CSS集群中各个节点“老年代”垃圾回收的运行次数的累计值之和。 |
≥ 0 |
sum_jvm_old_gc_time |
JVM老年代总GC时间 |
CSS集群中各个节点执行“老年代”垃圾回收所花费的时间累计值之和。 单位:ms |
≥ 0ms |
sum_jvm_young_gc_count |
JVM年轻代总GC次数 |
CSS集群中各个节点“年轻代”垃圾回收的运行次数的累计值之和。 |
≥ 0 |
sum_jvm_young_gc_time |
JVM年轻代总GC时间 |
CSS集群中各个节点执行“年轻代”垃圾回收所花费的时间累计值之和。 单位:ms |
≥ 0 ms |
sum_current_opened_http_count |
当前已打开http连接数 |
CSS集群中各个节点打开且尚未关闭的Http连接数之和。 |
≥ 0 |
sum_total_opened_http_count |
历史已打开http连接数 |
CSS集群中各个节点打开过的Http连接数累计值之和。 |
≥ 0 |
IndexingLatency |
平均索引延迟 |
分片完成索引操作所需的平均时间。 单位:ms |
≥ 0 ms |
IndexingRate |
平均索引速率 |
入库TPS,集群每秒平均索引操作数。 单位:s。 |
≥ 0s |
SearchLatency |
平均查询延迟 |
分片完成搜索操作所需的平均时间。 单位:ms。 |
≥ 0 bytes |
SearchRate |
平均查询速率 |
查询QPS,集群每秒平均查询操作数。 单位:s |
≥ 0/s |
维度
Key |
Value |
---|---|
cluster_id |
CSS集群 |