更新时间:2022-04-28 GMT+08:00
清理多版本数据
功能描述
多版本数据保留周期是在表每次执行insert overwrite或者truncate语句时触发,所以当表的多版本数据在保留周期时间外但是后续该表不会再执行insert overwrite或者truncate语句时,多版本保留周期外的数据不会自动清理。可以通过本章节介绍的SQL命令手动进行多版本数据清理。
语法格式
清理多版本保留周期外数据。
clear history for table [db_name.]table_name older_than '时间戳';
关键字
- clear history for table:清理多版本数据。
- older_than:指定清理多版本数据的时间范围。
参数说明
参数 |
描述 |
---|---|
db_name |
数据库名称,由字母、数字和下划线(_)组成。不能是纯数字,且不能以数字和下划线开头。 |
table_name |
表名称。 |
时间戳 |
删除该时间戳时间点之前的多版本数据。时间格式需要为yyyy-MM-dd HH:mm:ss |
注意事项
- DLI数据多版本功能当前仅支持通过Hive语法创建的OBS表,具体建表SQL语法可以参考使用Hive语法创建OBS表。
- 该命令不会删除当前版本数据。
示例
删除dliTable表在2021-09-25 23:59:59之前生成的多版本数据(多版本生成时会自带一个生成时间时的时间戳)。
clear history for table dliTable older_than '2021-09-25 23:59:59';
父主题: 多版本备份恢复数据