并行导入
GaussDB(DWS)提供了并行导入功能,以快速、高效地完成大量数据导入。介绍GaussDB(DWS)并行导入的相关参数。
raise_errors_if_no_files
参数说明:导入时是否区分“导入文件记录数为空”和“导入文件不存在”。raise_errors_if_no_files=TRUE,则“导入文件不存在”的时候,GaussDB(DWS)将抛出“文件不存在的”错误。
参数类型:SUSET
取值范围:布尔型
- on表示导入时区分“导入文件记录数为空”和“导入文件不存在”。
- off表示导入时不区分“导入文件记录数为空”和“导入文件不存在”。
默认值:off
partition_max_cache_size
参数说明:为了优化对列存分区表的批量插入,在批量插入过程中会对数据进行缓存后再批量写盘。通过partition_max_cache_size可指定数据缓存区大小。该值设置过大,将消耗较多系统内存资源;设置过小,将降低列存分区表批量插入性能。
参数类型:USERSET
取值范围:4096~ INT_MAX / 2,最小单位为KB。
默认值:2GB
partition_mem_batch
参数说明:为了优化对列存分区表的批量插入,在批量插入过程中会对数据进行缓存后再批量写盘。在partition_max_cache_size设置的情况下,通过partition_mem_batch可指定缓存个数。该参数值设置越大,每个分区可用的缓存越小,降低列存分区表批量插入性能;设置越小,每个分区可用的缓存会越大,会消耗较多系统内存资源。
参数类型:USERSET
取值范围:1~ 65535
默认值:256
gds_debug_mod
参数说明:为了增强对Gauss Data Service (以下简称GDS)相关问题的分析定位能力,可以通过此参数选择是否开启GDS的debug功能。参数开启后,将在集群节点对应的日志中输出GDS每次收发的包裹类型、命令交互的对端以及其他交互相关的细节信息,方便记录Gaussdb端状态机的状态跳转,以及目前所处的状态信息。此参数打开会输出额外日志,增加日志IO开销,进而影响性能和日志的信息有效性,因此请仅在定位GDS问题时开启。
参数类型:USERSET
取值范围:布尔型
- on表示开启GDS debug功能。
- off表示不开启GDS debug功能。
默认值:off
max_copy_data_display
参数说明:为copy错误表rawrecord字段长度增加guc管控,该字段为text类型,最大为1G减去8203B(即1073733621B)。该参数仅8.2.1.100及以上版本支持。
设置该参数时,表示能显示的最长字符数,超过该长度结尾显示‘...’。
参数类型:USERSET
取值范围:0~1073733616
默认值:1024