内存资源监控
内存监控
GaussDB(DWS)提供了监控整个集群内存使用状态的视图:
1
|
SELECT * FROM pgxc_total_memory_detail; |
1 2 3 |
SELECT * FROM pgxc_total_memory_detail; ERROR: unsupported view for memory protection feature is disabled. CONTEXT: PL/pgSQL function pgxc_total_memory_detail() line 12 at FOR over EXECUTE statement |
- 登录GaussDB(DWS) 管理控制台。
- 在左侧导航栏中,单击“集群管理”。
- 在集群列表中找到所需要的集群,单击集群名称,进入集群“基本信息”页面。
- 单击“参数修改”页签,修改参数“enable_memory_limit”的值为on,然后单击“保存”。
- 修改参数“max_process_memory”的值为合适的值,修改建议请参见max_process_memory,然后单击“保存”。
- 在“修改预览”窗口,确认修改无误后,单击“保存”。修改完成后需要重启集群,参数才会生效。
共享内存监控
用户可以通过视图pg_shared_memory_detail查询共享内存上下文信息:
1 2 3 4 5 6 7 8 9 |
SELECT * FROM pg_shared_memory_detail; contextname | level | parent | totalsize | freesize | usedsize ---------------------------------+-------+---------------------------------+-----------+----------+---------- ProcessMemory | 0 | | 24576 | 9840 | 14736 Workload manager memory context | 1 | ProcessMemory | 2105400 | 7304 | 2098096 wlm collector hash table | 2 | Workload manager memory context | 8192 | 3736 | 4456 Resource pool hash table | 2 | Workload manager memory context | 24576 | 15968 | 8608 wlm cgroup hash table | 2 | Workload manager memory context | 24576 | 15968 | 8608 (5 rows) |
该视图列举了内存使用的上下文名称、级别、上级内存上下文、共享内存总大小等。
另外,在数据库中,GUC参数“memory_tracking_mode”用来设置内存信息统计的模式,共支持四种模式:
- none,不启动内存统计功能。
- normal,仅做内存实时统计,不生成文件。
- executor,生成统计文件,包含执行层使用过的所有已分配内存的上下文信息。
当为executor模式时,将在DN进程的pg_log目录下生成csv格式文件,命名方式为:memory_track_<DN名称>_query_<queryid>.csv。作业执行时,执行器postgres线程和所有stream线程执行的算子信息,都将输入该文件。
文件内容根据以下内容组成示例如下:
0, 0, ExecutorState, 0, PortalHeapMemory, 0, 40K, 602K, 23 1, 3, CStoreScan_29360131_25, 0, ExecutorState, 1, 265K, 554K, 23 2, 128, cstore scan per scan memory context, 1, CStoreScan_29360131_25, 2, 24K, 24K, 23 3, 127, cstore scan memory context, 1, CStoreScan_29360131_25, 2, 264K, 264K, 23 4, 7, InitPartitionMapTmpMemoryContext, 1, CStoreScan_29360131_25, 2, 31K, 31K, 23 5, 2, VecPartIterator_29360131_24, 0, ExecutorState, 1, 16K, 16K, 23 0, 0, ExecutorState, 0, PortalHeapMemory, 0, 24K, 1163K, 20 1, 3, CStoreScan_29360131_22, 0, ExecutorState, 1, 390K, 1122K, 20 2, 20, cstore scan per scan memory context, 1, CStoreScan_29360131_22, 2, 476K, 476K, 20 3, 19, cstore scan memory context, 1, CStoreScan_29360131_22, 2, 264K, 264K, 20 4, 7, InitPartitionMapTmpMemoryContext, 1, CStoreScan_29360131_22, 2, 23K, 23K, 20 5, 2, VecPartIterator_29360131_21, 0, ExecutorState, 1, 16K, 16K, 20
其中各字段分别为:输出顺序号、线程内分配内存上下文的顺序号、当前内存上下文的名称、父内存上下文的输出顺序号、父内存上下文的名称、内存上下文树形层次级别号、当前内存上下文使用的内存峰值、当前内存上下文及其所有子内存上下文使用的内存峰值、当前线程所在query的plannodeid。
在本例中,记录“1, 3, CStoreScan_29360131_22, 0, ExecutorState, 1, 390K, 1122K, 20”和Explain Analyze的对应关系如下:
- CstoreScan_29360131_22代表CstoreScan算子。
- 1122K代表CstoreScan算子的PeakMemory。
- fullexec,生成文件包含执行层申请过的所有内存上下文信息。
当设置为fullexec模式时,输出信息和executor模式相同,但可能增加部分内存上下文分配信息,因为所有申请内存(无论是否申请成功)相关的信息都会被打印出来。由于仅记录内存申请信息,故记录中内存上下文使用的峰值均为0。