更新时间:2022-04-28 GMT+08:00

清理多版本数据

功能描述

多版本数据保留周期是在表每次执行insert overwrite或者truncate语句时触发,所以当表的多版本数据在保留周期时间外但是后续该表不会再执行insert overwrite或者truncate语句时,多版本保留周期外的数据不会自动清理。可以通过本章节介绍的SQL命令手动进行多版本数据清理。

语法格式

清理多版本保留周期外数据。
clear history for table [db_name.]table_name older_than '时间戳';

关键字

  • clear history for table:清理多版本数据。
  • older_than:指定清理多版本数据的时间范围。

参数说明

表1 参数说明

参数

描述

db_name

数据库名称,由字母、数字和下划线(_)组成。不能是纯数字,且不能以数字和下划线开头。

table_name

表名称。

时间戳

删除该时间戳时间点之前的多版本数据。时间格式需要为yyyy-MM-dd HH:mm:ss

注意事项

  • DLI数据多版本功能当前仅支持通过Hive语法创建的OBS表,具体建表SQL语法可以参考使用Hive语法创建OBS表
  • 该命令不会删除当前版本数据。

示例

删除dliTable表在2021-09-25 23:59:59之前生成的多版本数据(多版本生成时会自带一个生成时间时的时间戳)。
clear history for table dliTable older_than '2021-09-25 23:59:59';