更新时间:2024-07-27 GMT+08:00

删除分区

功能描述

本节操作介绍删除分区表的一个或多个分区。

分区表分为两种,OBS表和DLI表。在删除分区时,DLI表和OBS表都支持利用指定条件删除分区表的一个或多个分区。OBS表还支持按指定筛选条件删除分区

注意事项

  • 所要删除分区的表必须是已经存在的表,否则会出错。
  • 所要删除的分区必须是已经存在的,否则会出错,可通过语句中添加“IF EXISTS”避免该错误。

语法格式

1
2
3
ALTER TABLE [db_name.]table_name
  DROP [IF EXISTS]
  PARTITION partition_spec1[,PARTITION partition_spec2,...];

关键字

  • DROP:删除表分区。
  • IF EXISTS:所要删除的分区必须是已经存在的,否则会出错。
  • PARTITION:分区。

参数说明

表1 参数描述

参数

描述

db_name

Database名称,由字母、数字和下划线(_)组成。不能是纯数字,且不能以下划线开头。

table_name

Database中的表名,由字母、数字和下划线(_)组成。不能是纯数字,且不能以下划线开头。匹配规则为:^(?!_)(?![0-9]+$)[A-Za-z0-9_$]*$。如果特殊字符需要使用单引号('')包围起来。

partition_specs

分区信息,key=value形式,key为分区字段,value为分区值。若分区字段为多个字段,可以不包含所有的字段,会删除匹配上的所有分区。“partition_specs”中的参数默认带有“( )”,例如:PARTITION (facultyNo=20, classNo=103);

示例

为了便于理解删除分区语句的使用方法,本节示例为您提供源数据,基于源数据提供删除分区的操作示例。

  1. 使用DataSource语法创建一个OBS表分区表。

    创建了一个名为student的OBS分区表,表中有学生学号(id),学生姓名(name),学生院系编号(facultyNo)和学生班级编号(classNo),该表使用学生院系编号(facultyNo)和学生班级编号(classNo)进行分区。

    1
    2
    3
    4
    5
    6
    7
    8
    create table if not exists student (
    id int,
    name STRING,
    facultyNo int,
    classNo INT)
    using csv
    options (path 'obs://bucketName/filePath')
    partitioned by (faculytNo, classNo);
    

  2. 在表格中插入分区数据。

    利用插入数据中的内容,可以插入以下数据

     1
     2
     3
     4
     5
     6
     7
     8
     9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    INSERT into student
    partition (facultyNo = 10, classNo = 101)
    values (1010101, "student01"), (1010102, "student02");
    
    INSERT into student
    partition (facultyNo = 10, classNo = 102)
    values (1010203, "student03"), (1010204, "student04");
    
    INSERT into student
    partition (facultyNo = 20, classNo = 101)
    values (2010105, "student05"), (2010106, "student06");
    
    INSERT into student
    partition (facultyNo = 20, classNo = 102)
    values (2010207, "student07"), (2010208, "student08");
    
    INSERT into student
    partition (facultyNo = 20, classNo = 103)
    values (2010309, "student09"), (2010310, "student10");
    
    INSERT into student
    partition (facultyNo = 30, classNo = 101)
    values (3010111, "student11"), (3010112, "student12");
    
    INSERT into student
    partition (facultyNo = 30, classNo = 102)
    values (3010213, "student13"), (3010214, "student14");
    

  3. 查看分区。

    利用查看指定表所有分区中的内容,可以查看相关的分区内容。

    示例代码如下:

    SHOW partitions student;

    表2 表数据示例

    facultyNo

    classNo

    facultyNo=10

    classNo=101

    facultyNo=10

    classNo=102

    facultyNo=20

    classNo=101

    facultyNo=20

    classNo=102

    facultyNo=20

    classNo=103

    facultyNo=30

    classNo=101

    facultyNo=30

    classNo=102

  4. 删除分区。

    • 示例1:指定多个筛选条件删除分区

      本示例删除facultyNo为20,classNo为103的分区;

      如需按指定筛选条件删除分区请参考指定筛选条件删除分区(只支持OBS表)

      示例代码如下:

      ALTER TABLE student
      DROP IF EXISTS
      PARTITION (facultyNo=20, classNo=103);

      重新利用第三步中的方法查看表中的分区,可以看到该分区被删除:

      SHOW partitions student;
    • 示例2:指定单个筛选条件删除分区

      本示例删除facultyNo为30的分区;在插入数据的过程中可以了解到,facultyNo为30的分区有两个。

      如需按指定筛选条件删除分区请参考指定筛选条件删除分区(只支持OBS表)

      示例代码如下:

      ALTER TABLE student
      DROP IF EXISTS
      PARTITION (facultyNo = 30);

      执行后结果:

      表3 表数据示例

      facultyNo

      classNo

      facultyNo=10

      classNo=101

      facultyNo=10

      classNo=102

      facultyNo=20

      classNo=101

      facultyNo=20

      classNo=102

      facultyNo=20

      classNo=103