如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度

Spark作业在执行shuffle类语句，包括group by、join等场景时，常常会出现数据倾斜的问题，导致作业任务执行缓慢。

该问题可以通过设置spark.sql.shuffle.partitions提高shuffle read task的并行度来进行解决。

用户可在JDBC中通过set方式设置dli.sql.shuffle.partitions参数。具体方法如下：

Statement st = conn.stamte()
st.execute("set spark.sql.shuffle.partitions=20")

父主题： Spark作业开发类

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消