更新时间:2024-11-05 GMT+08:00

执行导出数据

前提条件

需要确保每一个CN和DN所在服务器到GDS服务器的IP和端口是互通的。

导出操作语法

执行数据导出语法:
1
INSERT INTO  [foreign table 表名] SELECT * FROM [源表名];

编写批处理任务脚本,实现并发批量导出数据。并发量视机器资源使用情况而定。可通过几个表测试,监控资源利用率,根据结果提高或减少并发量。常用资源监控命令有:内存和CPU监控top命令,I/O监控命令iostat,网络监控命令sar等。相关案例请参见多线程导出

任务示例

  • 示例1:将表reason的数据通过外表foreign_tpcds_reasons导出到数据文件中。
    1
    INSERT INTO foreign_tpcds_reasons SELECT * FROM tpcds.reason;
    
  • 示例2:通过条件过滤(r_reason_sk =1),向数据文件中导出部分数据。
    1
    INSERT INTO foreign_tpcds_reasons SELECT * FROM tpcds.reason WHERE r_reason_sk=1;
    
  • 示例3:对于特殊的数据类型如RAW类型,在导出之后是一个二进制文本,导入工具无法识别。需使用RAWTOHEX()函数将其转换为16进制文本导出。
    1
    INSERT INTO foreign_tpcds_reasons SELECT RAWTOHEX(c) FROM tpcds.reason;