Hive分区修剪的谓词下推增强

分区裁剪是一种优化技术，它通过在执行查询时仅扫描满足查询条件的分区，而不是扫描整个表的所有分区，来减少数据扫描量，从而提高查询性能。

在旧版本中，对Hive表的分区修剪的过滤条件（即谓词）下推，只支持列名与整数或者字符串的比较表达式的下推，在2.3版本中，增加了对null、in、and、or表达式的下推支持。

选择“集群 > 服务 > Spark2x/Spark > 配置”，单击“全部配置”，搜索并调整以下参数。

参数	说明	取值示例
spark.sql.hive.advancedPartitionPredicatePushdown.enabled	用于配置是否开启Hive表的分区谓词下推增强功能。 true：开启Hive表的分区谓词下推增强功能，Spark会尝试将更多的过滤条件（即谓词）推送到分区裁剪中。 false：关闭Hive表的分区谓词下推增强功能开启分区谓词下推增强功能可以显著提高分区表的查询性能。但在启用时，需要考虑潜在的兼容性问题，并根据实际使用情况进行调整。	true

参数

说明

取值示例

spark.sql.hive.advancedPartitionPredicatePushdown.enabled

用于配置是否开启Hive表的分区谓词下推增强功能。

开启分区谓词下推增强功能可以显著提高分区表的查询性能。但在启用时，需要考虑潜在的兼容性问题，并根据实际使用情况进行调整。

true