DLI支持的Prometheus基础监控指标
表1提供了DLI支持的Prometheus基础监控指标,AOM Prometheus支持免费存储基础指标。
除基础指标外,AOM Prometheus提供的自定义指标按计费规则付费使用。
监控指标 |
指标含义 |
---|---|
flink_jobmanager_Status_JVM_CPU_Load |
JobManager CPU的负载 |
flink_jobmanager_Status_JVM_CPU_Time |
JobManager CPU的使用 |
flink_taskmanager_Status_JVM_CPU_Load |
TaskManager CPU的负载 |
flink_taskmanager_Status_JVM_CPU_Time |
TaskManager CPU的使用 |
flink_jobmanager_Status_JVM_Memory_Heap_Used |
JobManager的堆内存使用量 |
flink_jobmanager_Status_JVM_Memory_Heap_Committed |
保证JobManager的JVM可用的堆内存量 |
flink_jobmanager_Status_JVM_Memory_Heap_Max |
JobManager中可用于内存管理的最大堆内存量 |
flink_jobmanager_Status_JVM_Memory_NonHeap_Used |
JobManager的堆外内存使用量 |
flink_jobmanager_Status_JVM_Memory_NonHeap_Committed |
保证JobManager的JVM可用的堆外内存量 |
flink_jobmanager_Status_JVM_Memory_NonHeap_Max |
JobManager中可用于内存管理的最大堆外内存量 |
flink_jobmanager_Status_JVM_Memory_Metaspace_Used |
JobManager MetaSpace内存池中当前使用的内存量 |
flink_jobmanager_Status_JVM_Memory_Metaspace_Committed |
JobManager MetaSpace内存池中保证可供JVM使用的内存量 |
flink_jobmanager_Status_JVM_Memory_Metaspace_Max |
JobManager MetaSpace内存池中可以使用的最大内存量 |
flink_jobmanager_Status_JVM_Memory_Direct_Count |
JobManager direct缓冲池中的缓冲区数 |
flink_jobmanager_Status_JVM_Memory_Direct_MemoryUsed |
JobManager中JVM用于direct缓冲池的内存量 |
flink_jobmanager_Status_JVM_Memory_Direct_TotalCapacity |
JobManager中direct缓冲池中所有缓冲区的总容量 |
flink_jobmanager_Status_JVM_Memory_Mapped_Count |
JobManager中mapped缓冲池中的缓冲区个数 |
flink_jobmanager_Status_JVM_Memory_Mapped_MemoryUsed |
JobManager中JVM用于mapped缓冲池的内存量 |
flink_jobmanager_Status_JVM_Memory_Mapped_TotalCapacity |
JobManager中mapped缓冲池中所有缓冲区的总容量 |
flink_jobmanager_Status_Flink_Memory_Managed_Used |
JobManager中已使用的托管内存量 |
flink_jobmanager_Status_Flink_Memory_Managed_Total |
JobManager中托管内存总量 |
flink_taskmanager_Status_JVM_Memory_Heap_Used |
TaskManager的堆内存使用量 |
flink_taskmanager_Status_JVM_Memory_Heap_Committed |
保证TaskManager的JVM可用的堆内存量 |
flink_taskmanager_Status_JVM_Memory_Heap_Max |
TaskManager中可用于内存管理的最大堆内存量 |
flink_taskmanager_Status_JVM_Memory_NonHeap_Used |
TaskManager的堆外内存使用量 |
flink_taskmanager_Status_JVM_Memory_NonHeap_Committed |
保证TaskManager的JVM可用的堆外内存量 |
flink_taskmanager_Status_JVM_Memory_NonHeap_Max |
TaskManager中可用于内存管理的最大堆外内存量 |
flink_taskmanager_Status_JVM_Memory_Metaspace_Used |
TaskManager MetaSpace内存池中当前使用的内存量 |
flink_taskmanager_Status_JVM_Memory_Metaspace_Committed |
TaskManager MetaSpace内存池中保证可供JVM使用的内存量 |
flink_taskmanager_Status_JVM_Memory_Metaspace_Max |
TaskManager MetaSpace内存池中可以使用的最大内存量 |
flink_taskmanager_Status_JVM_Memory_Direct_Count |
TaskManager direct缓冲池中的缓冲区数 |
flink_taskmanager_Status_JVM_Memory_Direct_MemoryUsed |
TaskManager中JVM用于direct缓冲池的内存量 |
flink_taskmanager_Status_JVM_Memory_Direct_TotalCapacity |
TaskManager中direct缓冲池中所有缓冲区的总容量 |
flink_taskmanager_Status_JVM_Memory_Mapped_Count |
TaskManager中mapped缓冲池中的缓冲区个数 |
flink_taskmanager_Status_JVM_Memory_Mapped_MemoryUsed |
TaskManager中JVM用于mapped缓冲池的内存量 |
flink_taskmanager_Status_JVM_Memory_Mapped_TotalCapacity |
TaskManager中mapped缓冲池中所有缓冲区的总容量 |
flink_taskmanager_Status_Flink_Memory_Managed_Used |
TaskManager中已使用的托管内存量 |
flink_taskmanager_Status_Flink_Memory_Managed_Total |
TaskManager中托管内存总量 |
flink_jobmanager_Status_JVM_Threads_Count |
JobManager中活动的线程总数 |
flink_taskmanager_Status_JVM_Threads_Count |
TaskManager中活动中的线程总数 |
flink_jobmanager_Status_JVM_GarbageCollector_ConcurrentMarkSweep_Count |
JobManager CMS垃圾回收器的回收次数 |
flink_jobmanager_Status_JVM_GarbageCollector_ConcurrentMarkSweep_Time |
JobManager CMS执行垃圾回收总耗时 |
flink_jobmanager_Status_JVM_GarbageCollector_ParNew_Count |
JobManager GC次数 |
flink_jobmanager_Status_JVM_GarbageCollector_ParNew_Time |
JobManager每次GC时间 |
flink_taskmanager_Status_JVM_GarbageCollector_ConcurrentMarkSweep_Count |
TaskManager CMS垃圾回收器的回收次数 |
flink_taskmanager_Status_JVM_GarbageCollector_ConcurrentMarkSweep_Time |
TaskManager CMS执行垃圾回收总耗时 |
flink_taskmanager_Status_JVM_GarbageCollector_ParNew_Count |
TaskManager GC次数 |
flink_taskmanager_Status_JVM_GarbageCollector_ParNew_Time |
TaskManager每次GC时间 |
flink_jobmanager_Status_JVM_ClassLoader_ClassesLoaded |
JobManager自JVM启动以来加载的类的总数 |
flink_jobmanager_Status_JVM_ClassLoader_ClassesUnloaded |
JobManager自JVM启动以来卸载的类的总数 |
flink_taskmanager_Status_JVM_ClassLoader_ClassesLoaded |
TaskManager自JVM启动以来加载的类的总数 |
flink_taskmanager_Status_JVM_ClassLoader_ClassesUnloaded |
TaskManager自JVM启动以来卸载的类的总数 |
flink_taskmanager_Status_Network_AvailableMemorySegments |
TaskManager未使用的内存segments的个数 |
flink_taskmanager_Status_Network_TotalMemorySegments |
TaskManager中分配的内存segments的总数 |
flink_taskmanager_Status_Shuffle_Netty_AvailableMemorySegments |
TM未使用的内存segments的个数 |
flink_taskmanager_Status_Shuffle_Netty_UsedMemorySegments |
TM已使用的内存segments的个数 |
flink_taskmanager_Status_Shuffle_Netty_TotalMemorySegments |
TM分配的内存segments的个数 |
flink_taskmanager_Status_Shuffle_Netty_AvailableMemory |
TM中未使用的内存量 |
flink_taskmanager_Status_Shuffle_Netty_UsedMemory |
TM中已使用的内存量 |
flink_taskmanager_Status_Shuffle_Netty_TotalMemory |
TM中分配的内存量 |
flink_jobmanager_job_numRestarts |
自作业提交以来的重新启动总数 |
flink_jobmanager_job_lastCheckpointDuration |
完成最新checkpoint所用的时间 |
flink_jobmanager_job_lastCheckpointSize |
最新checkpoint的大小,如果启用了增量检查点或更改日志,则此度量可能与lastCheckpointFullSize不同。 |
flink_jobmanager_job_numberOfInProgressCheckpoints |
正在进行的checkpoint的数量 |
flink_jobmanager_job_numberOfCompletedCheckpoints |
成功完成的checkpoint的数量 |
flink_jobmanager_job_numberOfFailedCheckpoints |
失败的checkpoint的数量 |
flink_jobmanager_job_totalNumberOfCheckpoints |
所有checkpoint的总数 |
flink_taskmanager_job_task_numBytesOut |
Task输出的字节总数 |
flink_taskmanager_job_task_numBytesOutPerSecond |
Task每秒输出的字节总数 |
flink_taskmanager_job_task_isBackPressured |
Task是否反压 |
flink_taskmanager_job_task_numRecordsIn |
Task收到的记录总数 |
flink_taskmanager_job_task_numRecordsInPerSecond |
Task每秒收到的记录总数 |
flink_taskmanager_job_task_numBytesIn |
Task收到的字节数 |
flink_taskmanager_job_task_numBytesInPerSecond |
Task每秒收到的字节数 |
flink_taskmanager_job_task_numRecordsOut |
Task发出的记录总数 |
flink_taskmanager_job_task_numRecordsOutPerSecond |
Task每秒发出的记录总数 |
flink_taskmanager_job_task_operator_numRecordsIn |
Operator收到的记录总数 |
flink_taskmanager_job_task_operator_numRecordsInPerSecond |
Operator每秒收到的记录总数 |
flink_taskmanager_job_task_operator_numRecordsOut |
Operator发出的记录总数 |
flink_taskmanager_job_task_operator_numRecordsOutPerSecond |
Operator每秒发出的记录总数 |
flink_taskmanager_job_task_operator_sourceIdleTime |
Source 闲置时长 |
flink_taskmanager_job_task_operator_currentEmitEventTimeLag |
数据的事件时间与数据离开 Source 时的间隔 |
flink_taskmanager_job_task_operator_pendingRecords |
尚未被 Source 拉取的数据数量 |