导出查询结果

功能描述

INSERT OVERWRITE DIRECTORY用于将查询结果直接写入到指定的目录，支持按CSV、Parquet、ORC、JSON、Avro格式进行存储。

语法格式

    
         INSERT OVERWRITE DIRECTORY path
  USING file_format
  [OPTIONS(key1=value1)]
  select_statement;

关键字

USING：指定所存储格式。
OPTIONS：导出时的属性列表，为可选项。

参数

表1 INSERT OVERWRITE DIRECTORY参数描述
参数	描述
path	要将查询结果写入的OBS路径。
file_format	写入的文件格式，支持按CSV、Parquet、ORC、JSON、Avro格式。

file_format为csv时，options参数可以参考表3。

注意事项

通过配置“spark.sql.shuffle.partitions”参数可以设置非DLI表在OBS桶中插入的文件个数，同时，为了避免数据倾斜，在INSERT语句后可加上“distribute by rand()”，可以增加处理作业的并发量。例如：
```
insert into table table_target select * from table_source distribute by cast(rand() * N as int);
```
配置项为OPTIONS('DELIMITER'=',')时，可以指定分隔符，默认值为“,”。
对于CSV数据，支持如下所述分隔符：
- 制表符tab，例如：'DELIMITER'='\t'。
- 支持通过unicode编码指定分割符，例如：'DELIMITER'='\u0001'。
- 单引号（'），单引号必须在双引号（" "）内。例如：'DELIMITER'= "'"。

示例

    
         INSERT OVERWRITE DIRECTORY 'obs://bucket/dir'
  USING csv
  OPTIONS(key1=value1)
  select * from db1.tb1;

父主题： Spark SQL语法参考（即将下线）

上一篇：清空数据

下一篇：多版本备份恢复数据

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

智能客服提问云社区提问

导出查询结果

功能描述

语法格式

关键字

参数

注意事项

示例

相关文档

意见反馈

文档内容是否对您有帮助？

7*24

备案

专业服务

退订

建议反馈

售前咨询热线