更新时间:2022-06-13 GMT+08:00

优化器方法配置

这些配置参数提供了影响查询优化器选择查询规划的原始方法。如果优化器为特定的查询选择的缺省规划并不是最优的,可以通过使用这些配置参数强制优化器选择一个不同的规划来临时解决这个问题。更好的方法包括调节优化器开销常量、手动运行ANALYZE、增加配置参数default_statistics_target的值、增加使用ALTER TABLE SET STATISTICS为指定列增加收集的统计信息。

enable_bitmapscan

参数说明:控制优化器对位图扫描规划类型的使用。

参数类型:USERSET

取值范围:布尔型

  • on表示使用。
  • off表示不使用。

默认值:on

enable_hashagg

参数说明:控制优化器对Hash聚集规划类型的使用。

参数类型:USERSET

取值范围:布尔型

  • on表示使用。
  • off表示不使用。

默认值:on

enable_hashjoin

参数说明:控制优化器对Hash连接规划类型的使用。

参数类型:USERSET

取值范围:布尔型

  • on表示使用。
  • off表示不使用。

默认值:on

enable_indexscan

参数说明:控制优化器对索引扫描规划类型的使用。

参数类型:USERSET

取值范围:布尔型

  • on表示使用。
  • off表示不使用。

默认值:on

enable_indexonlyscan

参数说明:控制优化器对仅索引扫描规划类型的使用。

参数类型:USERSET

取值范围:布尔型

  • on表示使用。
  • off表示不使用。

默认值:on

enable_material

参数说明:控制优化器对实体化的使用。消除整个实体化是不可能的,但是可以关闭这个变量以防止优化器插入实体节点。

参数类型:USERSET

取值范围:布尔型

  • on表示使用。
  • off表示不使用。

默认值:on

enable_mergejoin

参数说明:控制优化器对融合连接规划类型的使用。

参数类型:USERSET

取值范围:布尔型

  • on表示使用。
  • off表示不使用。

默认值:off

enable_nestloop

参数说明:控制优化器对内表全表扫描嵌套循环连接规划类型的使用。完全消除嵌套循环连接是不可能的,但是关闭这个变量就会让优化器在存在其他方法的时候优先选择其他方法。

参数类型:USERSET

取值范围:布尔型

  • on表示使用。
  • off表示不使用。

默认值:off

enable_index_nestloop

参数说明:控制优化器对内表参数化索引扫描嵌套循环连接规划类型的使用。

参数类型:USERSET

取值范围:布尔型

  • on表示使用。
  • off表示不使用。

默认值:新安装集群的场景下是on,如果集群是从R8C10版本升级上来的,则保持前向兼容。如果是从R7C10或者更早的版本升级上来,则默认值是off。

enable_seqscan

参数说明:控制优化器对顺序扫描规划类型的使用。完全消除顺序扫描是不可能的,但是关闭这个变量会让优化器在存在其他方法的时候优先选择其他方法。

参数类型:USERSET

取值范围:布尔型

  • on表示使用。
  • off表示不使用。

默认值:on

enable_sort

参数说明:控制优化器使用的排序步骤。完全消除明确的排序是不可能的,但是关闭这个变量可以让优化器在存在其他方法的时候优先选择其他方法。

参数类型:USERSET

取值范围:布尔型

  • on表示使用。
  • off表示不使用。

默认值:on

enable_tidscan

参数说明:控制优化器对TID扫描规划类型的使用。

参数类型:USERSET

取值范围:布尔型

  • on表示使用。
  • off表示不使用。

默认值:on

enable_kill_query

参数说明:CASCADE模式删除用户时,会删除此用户拥有的所有对象。此参数标识是否允许在删除用户的时候,取消锁定此用户所属对象的query。

参数类型:SUSET

取值范围:布尔型

  • on表示允许取消锁定。
  • off表示不允许取消锁定。

默认值:off

enforce_oracle_behavior

参数说明:控制正则表达式的规则匹配模式。

参数类型:USERSET

取值范围:布尔型

  • on表示正则表达式采用ORACLE格式的匹配规则。
  • off表示正则表达式采用POSIX格式的匹配规则。

默认值:on

enable_stream_concurrent_update

参数说明:控制优化器在并发更新场景下对stream的使用,该参数受限于enable_stream_operator参数。

参数类型:USERSET

取值范围:布尔型

  • on表示允许优化器对update语句生成stream计划。
  • off表示优化器对update语句仅能生成非stream计划。

默认值:on

enable_stream_operator

参数说明:控制优化器对stream的使用。

参数类型:USERSET

取值范围:布尔型

  • on表示使用。
  • off表示不使用。

默认值:on

enable_stream_recursive

参数说明:控制是否将with-recursive关联查询下推DN分布式执行。

参数类型:USERSET

取值范围:布尔型

  • on表示支持使用with-recursive关联查询下推DN分布式执行。
  • off表示不支持使用with_recursive下推。

默认值:on

max_recursive_times

参数说明:控制with recursive的最大迭代次数。

参数类型:USERSET

取值范围:整型,0~INT_MAX。

默认值:200

enable_vector_engine

参数说明:控制优化器对向量化执行引擎的使用。

参数类型:USERSET

取值范围:布尔型

  • on表示使用。
  • off表示不使用。

默认值:on

enable_broadcast

参数说明:控制优化器对stream代价估算时对broadcast分布方式的使用。

参数类型:USERSET

取值范围:布尔型

  • on表示使用。
  • off表示不使用。

默认值:on

enable_change_hjcost

参数说明:控制优化器在Hash Join代价估算路径选择时,是否使用将内表运行时代价排除在Hash Join节点运行时代价外的估算方式。如果使用,则有利于选择条数少,但运行代价大的表做内表。

参数类型:SUSET

取值范围:布尔型

  • on表示使用。
  • off表示不使用。

默认值:off

enable_fstream

参数说明:控制优化器下发语句时对stream的使用,该参数只限定于HDFS外表使用。

该参数现在已经废弃。为了保留前向兼容,可以设置成功,但是实际不起任何作用。

参数类型:USERSET

取值范围:布尔型

  • on表示使用。
  • off表示不使用。

默认值:off

best_agg_plan

参数说明:对于stream下的Agg操作,优化器会生成三种计划:
  1. hashagg+gather(redistribute)+hashagg。
  2. redistribute+hashagg(+gather)。
  3. hashagg+redistribute+hashagg(+gather)。

本参数用于控制优化器生成哪种hashagg的计划。

参数类型:USERSET

取值范围:0,1,2,3

  • 取值为1时,强制生成第一种计划。
  • 取值为2时,如果group by列可以重分布,强制生成第二种计划,否则生成第一种计划。
  • 取值为3时,如果group by列可以重分布,强制生成第三种计划,否则生成第一种计划。
  • 取值为0时,优化器会根据以上三种计划的估算cost选择最优的一种计划生成。

默认值:0

agg_redistribute_enhancement

参数说明:当进行Agg操作时,如果包含多个group by列且均不为分布列,进行重分布时会选择某一group by列进行重分布。本参数控制选择重分布列的策略。

参数类型:USERSET

取值范围:布尔型

  • on表示会选择估算distinct值最多的一个可重分布列作为重分布列。
  • off表示会选择第一个可重分布列为重分布列。

默认值:off

enable_valuepartition_pruning

参数说明:是否对DFS分区表进行静态/动态优化。

参数类型:USERSET

取值范围:布尔型

  • on表示对DFS分区表进行静态/动态优化。
  • off表示不对DFS分区表进行静态/动态优化。

默认值:on

expected_computing_nodegroup

参数说明:标识选定的计算Node Group模式或目标计算Node Group。Node Group目前为内部用机制,用户无需设置。

共4种计算Node Group模式,用于关联操作和聚集操作时选定计算Node Group。在每一种模式中,优化器有针对性地选定几个候选计算Node Group,然后根据代价,从中为当前算子挑选更合适的计算Node Group。

参数类型:USERSET

取值范围:字符串

  • optimal:候选计算Node Group列表包含算子操作对象所在的Node Group和由当前用户具有COMPUTE权限的所有Node Group包含的所有DN构成的Node Group。
  • query:候选计算Node Group列表包含算子操作对象所在的Node Group和由当前查询涉及的所有基表所在Node Group包含的所有DN构成的Node Group。
  • bind:当前session用户是逻辑集群用户时,候选计算Node Group为当前用户关联的逻辑集群的Node Group;当session用户不是逻辑集群用户时,候选计算Node Group选取规则和参数设置为query时的规则一致。
  • Node Group名:

默认值:bind

enable_nodegroup_debug

参数说明:控制优化器在多Node Group环境下,是否使用强制弹性计算。Node Group目前为内部用机制,用户无需设置。

该参数只在expected_computing_nodegroup被设置为具体Node Group时生效。

参数类型:USERSET

取值范围:布尔型

  • on表示强制将计算弹性到expected_computing_nodegroup所指定的Node Group进行计算。
  • off表示不强制使用某个Node Group进行计算。

默认值:off

stream_multiple

参数说明:设置优化器计算Stream算子的开销时的加权。

在原代价模型的基础上,最终Stream代价将被乘以此加权参数。

参数类型:USERSET

取值范围:浮点型,0~DBL_MAX。

默认值:1

此参数仅对Redistribute和Broadcast类型的Stream有效。

qrw_inlist2join_optmode

参数说明:控制是否使用inlist-to-join查询重写。

参数类型:USERSET

取值范围:字符串

  • disable:关闭inlist2join查询重写。
  • cost_base:基于代价的inlist2join查询重写。
  • rule_base:基于规则的inlist2join查询重写,即强制使用inlist2join查询重写。
  • 任意正整数:inlist2join查询重写阈值,即list内元素个数大于该阈值,进行inlist2join查询重写。

默认值:cost_base

skew_option

参数说明:控制是否使用优化策略。

参数类型:USERSET

取值范围:字符串

  • off:关闭策略。
  • normal:采用激进策略。对于不确定是否出现倾斜的场景,认为存在倾斜,并进行相应优化。
  • lazy:采用保守策略。对于不确定是否出现倾斜场景,认为不存在倾斜,不进行优化。

默认值:normal