SQL语句改写规则

根据数据库的SQL执行机制以及大量的实践，总结发现：通过一定的规则调整SQL语句，在保证结果正确的基础上，能够提高SQL执行效率。如果遵守下列规则，能够大幅度提升业务查询效率。

使用union all代替union
union在合并两个集合时会执行去重操作，而union all则直接将两个结果集合并、不执行去重。执行去重会消耗大量的时间，因此，在一些实际应用场景中，如果通过业务逻辑已确认两个集合不存在重叠，可用union all替代union以便提升性能。
join列增加非空过滤条件
如果join列上的NULL值较多，则可以加上is not null过滤条件，以实现数据的提前过滤，提高join效率。
选择hashagg。
查询中GROUP BY语句如果生成了groupagg+sort的plan性能会比较差，可以通过加大work_mem的方法生成hashagg的plan，因为不用排序而提高性能。
尝试将函数替换为case语句。
DataArts Fabric SQL函数调用性能较低，如果出现过多的函数调用导致性能下降很多，可以根据情况把可下推函数的函数改成CASE表达式。
避免对分区键使用函数或表达式运算。
对分区键使用函数或表达式运算会影响分区剪枝的应用，造成数据扫描量的增多。
尽量避免在where子句中使用!=或<>操作符、null值判断、or连接、参数隐式转换。
对复杂SQL语句进行拆分。
对于过于复杂并且不易通过以上方法调整性能的SQL可以考虑拆分的方法，把SQL中某一部分拆分成独立的SQL并把执行结果存入临时表，拆分常见的场景包括但不限于：
- 作业中多个SQL有同样的子查询，并且子查询数据量较大。
- 函数（如subst，to_number）导致大数据量子查询选择度计算不准。
- 多DN环境下对大表做broadcast的子查询。