更新时间:2025-07-17 GMT+08:00
分享

冷热分离概述

在海量大数据场景下,表中的部分业务数据随着时间的推移仅作为归档数据或者访问频率很低,同时这部分历史数据体量非常大,比如订单数据或者监控数据,如果降低这部分数据的存储成本将会极大的节省企业的成本。CloudTable HBase支持冷热分离功能,将数据分类存储在不同介质上,有效降低存储成本。针对数据使用场景,可以将数据按照时间访问频率分为热数据和冷数据。冷热数据主要从数据访问频率、更新频率划分。

  • Hot(热数据):访问、更新频率较高,对访问的响应时间要求很高的数据。
  • Cold(冷数据):不允许更新或更新访问频率较低,对访问的响应时间要求不高的数据。

原理介绍

CloudTable HBase支持对同一张表的数据进行冷热分离存储。用户在表上配置数据冷热时间分界点后,HBase会依赖用户写入数据的时间戳(毫秒)和时间分界点来判断数据的冷热。数据开始存储在热存储上,随着时间的推移慢慢往冷存储上迁移。同时用户可以任意变更数据的冷热分界点,数据可以从热存储到冷存储,也可以从冷存储到热存储。

图1 原理图

使用限制

  • 普通IO读IOPS的能力降低,因此只适用于低频查询的场景。
  • 普通IO不适合并发大量读请求的场景,并发大量读请求可能会导致请求异常。
  • 冷热分离特性仅支持HBase 2.4.14及以上版本。
  • 冷热分离场景下,热盘不支持缩容。
  • 普通IO集群不支持冷热分离。
  • HBase冷热分离只能在创建集群时开启。

相关文档