清理多版本数据
功能描述
多版本数据保留周期是在表每次执行insert overwrite或者truncate语句时触发,所以当表的多版本数据在保留周期时间外但是后续该表不会再执行insert overwrite或者truncate语句时,多版本保留周期外的数据不会自动清理。可以通过本章节介绍的SQL命令手动进行多版本数据清理。
语法格式
clear history for table [db_name.]table_name older_than '时间戳';
关键字
- clear history for table:清理多版本数据。
- older_than:指定清理多版本数据的时间范围。
参数说明
参数 |
描述 |
---|---|
db_name |
数据库名称,由字母、数字和下划线(_)组成。不能是纯数字,且不能以数字和下划线开头。 |
table_name |
表名称。 |
时间戳 |
删除该时间戳时间点之前的多版本数据。时间格式需要为yyyy-MM-dd HH:mm:ss |
注意事项
- DLI数据多版本功能当前仅支持通过Hive语法创建的OBS表,具体建表SQL语法可以参考使用Hive语法创建OBS表。
- 该命令不会删除当前版本数据。
示例
clear history for table dliTable older_than '2021-09-25 23:59:59';