文档首页/ 数据湖探索 DLI/ 用户指南/ 使用AOM监控DLI服务/ DLI支持的Prometheus基础监控指标
更新时间:2024-12-13 GMT+08:00
分享

DLI支持的Prometheus基础监控指标

表1提供了DLI支持的Prometheus基础监控指标,AOM Prometheus支持免费存储基础指标。

除基础指标外,AOM Prometheus提供的自定义指标按计费规则付费使用。

表1 DLI支持的Prometheus监控指标

监控指标

指标含义

flink_jobmanager_Status_JVM_CPU_Load

JobManager CPU的负载

flink_jobmanager_Status_JVM_CPU_Time

JobManager CPU的使用

flink_taskmanager_Status_JVM_CPU_Load

TaskManager CPU的负载

flink_taskmanager_Status_JVM_CPU_Time

TaskManager CPU的使用

flink_jobmanager_Status_JVM_Memory_Heap_Used

JobManager的堆内存使用量

flink_jobmanager_Status_JVM_Memory_Heap_Committed

保证JobManager的JVM可用的堆内存量

flink_jobmanager_Status_JVM_Memory_Heap_Max

JobManager中可用于内存管理的最大堆内存量

flink_jobmanager_Status_JVM_Memory_NonHeap_Used

JobManager的堆外内存使用量

flink_jobmanager_Status_JVM_Memory_NonHeap_Committed

保证JobManager的JVM可用的堆外内存量

flink_jobmanager_Status_JVM_Memory_NonHeap_Max

JobManager中可用于内存管理的最大堆外内存量

flink_jobmanager_Status_JVM_Memory_Metaspace_Used

JobManager MetaSpace内存池中当前使用的内存量

flink_jobmanager_Status_JVM_Memory_Metaspace_Committed

JobManager MetaSpace内存池中保证可供JVM使用的内存量

flink_jobmanager_Status_JVM_Memory_Metaspace_Max

JobManager MetaSpace内存池中可以使用的最大内存量

flink_jobmanager_Status_JVM_Memory_Direct_Count

JobManager direct缓冲池中的缓冲区数

flink_jobmanager_Status_JVM_Memory_Direct_MemoryUsed

JobManager中JVM用于direct缓冲池的内存量

flink_jobmanager_Status_JVM_Memory_Direct_TotalCapacity

JobManager中direct缓冲池中所有缓冲区的总容量

flink_jobmanager_Status_JVM_Memory_Mapped_Count

JobManager中mapped缓冲池中的缓冲区个数

flink_jobmanager_Status_JVM_Memory_Mapped_MemoryUsed

JobManager中JVM用于mapped缓冲池的内存量

flink_jobmanager_Status_JVM_Memory_Mapped_TotalCapacity

JobManager中mapped缓冲池中所有缓冲区的总容量

flink_jobmanager_Status_Flink_Memory_Managed_Used

JobManager中已使用的托管内存量

flink_jobmanager_Status_Flink_Memory_Managed_Total

JobManager中托管内存总量

flink_taskmanager_Status_JVM_Memory_Heap_Used

TaskManager的堆内存使用量

flink_taskmanager_Status_JVM_Memory_Heap_Committed

保证TaskManager的JVM可用的堆内存量

flink_taskmanager_Status_JVM_Memory_Heap_Max

TaskManager中可用于内存管理的最大堆内存量

flink_taskmanager_Status_JVM_Memory_NonHeap_Used

TaskManager的堆外内存使用量

flink_taskmanager_Status_JVM_Memory_NonHeap_Committed

保证TaskManager的JVM可用的堆外内存量

flink_taskmanager_Status_JVM_Memory_NonHeap_Max

TaskManager中可用于内存管理的最大堆外内存量

flink_taskmanager_Status_JVM_Memory_Metaspace_Used

TaskManager MetaSpace内存池中当前使用的内存量

flink_taskmanager_Status_JVM_Memory_Metaspace_Committed

TaskManager MetaSpace内存池中保证可供JVM使用的内存量

flink_taskmanager_Status_JVM_Memory_Metaspace_Max

TaskManager MetaSpace内存池中可以使用的最大内存量

flink_taskmanager_Status_JVM_Memory_Direct_Count

TaskManager direct缓冲池中的缓冲区数

flink_taskmanager_Status_JVM_Memory_Direct_MemoryUsed

TaskManager中JVM用于direct缓冲池的内存量

flink_taskmanager_Status_JVM_Memory_Direct_TotalCapacity

TaskManager中direct缓冲池中所有缓冲区的总容量

flink_taskmanager_Status_JVM_Memory_Mapped_Count

TaskManager中mapped缓冲池中的缓冲区个数

flink_taskmanager_Status_JVM_Memory_Mapped_MemoryUsed

TaskManager中JVM用于mapped缓冲池的内存量

flink_taskmanager_Status_JVM_Memory_Mapped_TotalCapacity

TaskManager中mapped缓冲池中所有缓冲区的总容量

flink_taskmanager_Status_Flink_Memory_Managed_Used

TaskManager中已使用的托管内存量

flink_taskmanager_Status_Flink_Memory_Managed_Total

TaskManager中托管内存总量

flink_jobmanager_Status_JVM_Threads_Count

JobManager中活动的线程总数

flink_taskmanager_Status_JVM_Threads_Count

TaskManager中活动中的线程总数

flink_jobmanager_Status_JVM_GarbageCollector_ConcurrentMarkSweep_Count

JobManager CMS垃圾回收器的回收次数

flink_jobmanager_Status_JVM_GarbageCollector_ConcurrentMarkSweep_Time

JobManager CMS执行垃圾回收总耗时

flink_jobmanager_Status_JVM_GarbageCollector_ParNew_Count

JobManager GC次数

flink_jobmanager_Status_JVM_GarbageCollector_ParNew_Time

JobManager每次GC时间

flink_taskmanager_Status_JVM_GarbageCollector_ConcurrentMarkSweep_Count

TaskManager CMS垃圾回收器的回收次数

flink_taskmanager_Status_JVM_GarbageCollector_ConcurrentMarkSweep_Time

TaskManager CMS执行垃圾回收总耗时

flink_taskmanager_Status_JVM_GarbageCollector_ParNew_Count

TaskManager GC次数

flink_taskmanager_Status_JVM_GarbageCollector_ParNew_Time

TaskManager每次GC时间

flink_jobmanager_Status_JVM_ClassLoader_ClassesLoaded

JobManager自JVM启动以来加载的类的总数

flink_jobmanager_Status_JVM_ClassLoader_ClassesUnloaded

JobManager自JVM启动以来卸载的类的总数

flink_taskmanager_Status_JVM_ClassLoader_ClassesLoaded

TaskManager自JVM启动以来加载的类的总数

flink_taskmanager_Status_JVM_ClassLoader_ClassesUnloaded

TaskManager自JVM启动以来卸载的类的总数

flink_taskmanager_Status_Network_AvailableMemorySegments

TaskManager未使用的内存segments的个数

flink_taskmanager_Status_Network_TotalMemorySegments

TaskManager中分配的内存segments的总数

flink_taskmanager_Status_Shuffle_Netty_AvailableMemorySegments

TM未使用的内存segments的个数

flink_taskmanager_Status_Shuffle_Netty_UsedMemorySegments

TM已使用的内存segments的个数

flink_taskmanager_Status_Shuffle_Netty_TotalMemorySegments

TM分配的内存segments的个数

flink_taskmanager_Status_Shuffle_Netty_AvailableMemory

TM中未使用的内存量

flink_taskmanager_Status_Shuffle_Netty_UsedMemory

TM中已使用的内存量

flink_taskmanager_Status_Shuffle_Netty_TotalMemory

TM中分配的内存量

flink_jobmanager_job_numRestarts

自作业提交以来的重新启动总数

flink_jobmanager_job_lastCheckpointDuration

完成最新checkpoint所用的时间

flink_jobmanager_job_lastCheckpointSize

最新checkpoint的大小,如果启用了增量检查点或更改日志,则此度量可能与lastCheckpointFullSize不同。

flink_jobmanager_job_numberOfInProgressCheckpoints

正在进行的checkpoint的数量

flink_jobmanager_job_numberOfCompletedCheckpoints

成功完成的checkpoint的数量

flink_jobmanager_job_numberOfFailedCheckpoints

失败的checkpoint的数量

flink_jobmanager_job_totalNumberOfCheckpoints

所有checkpoint的总数

flink_taskmanager_job_task_numBytesOut

Task输出的字节总数

flink_taskmanager_job_task_numBytesOutPerSecond

Task每秒输出的字节总数

flink_taskmanager_job_task_isBackPressured

Task是否反压

flink_taskmanager_job_task_numRecordsIn

Task收到的记录总数

flink_taskmanager_job_task_numRecordsInPerSecond

Task每秒收到的记录总数

flink_taskmanager_job_task_numBytesIn

Task收到的字节数

flink_taskmanager_job_task_numBytesInPerSecond

Task每秒收到的字节数

flink_taskmanager_job_task_numRecordsOut

Task发出的记录总数

flink_taskmanager_job_task_numRecordsOutPerSecond

Task每秒发出的记录总数

flink_taskmanager_job_task_operator_numRecordsIn

Operator收到的记录总数

flink_taskmanager_job_task_operator_numRecordsInPerSecond

Operator每秒收到的记录总数

flink_taskmanager_job_task_operator_numRecordsOut

Operator发出的记录总数

flink_taskmanager_job_task_operator_numRecordsOutPerSecond

Operator每秒发出的记录总数

flink_taskmanager_job_task_operator_sourceIdleTime

Source 闲置时长

flink_taskmanager_job_task_operator_currentEmitEventTimeLag

数据的事件时间与数据离开 Source 时的间隔

flink_taskmanager_job_task_operator_pendingRecords

尚未被 Source 拉取的数据数量

相关文档