更新时间:2024-12-11 GMT+08:00

ClickHouse容量规划设计

为了能够更好的发挥ClickHouse分布式查询能力,在集群规划阶段需要合理设计集群数据分布存储。

当前ClickHouse能力为单机磁盘容量达到80%后会上报告警信息,磁盘容量达90%后集群会处于只读状态。

出现磁盘告警信息后需要考虑是否是容量不足问题,如果是容量不足问题需要尽快考虑集群扩容,提升集群整体容量存储。

ClickHouse节点及容量规划如下:

  • 磁盘规划

    由于ClickHouseServer业务数据主要存储在本地磁盘上,数据量可能会随着集群使用时间增长而增长,通常建议ClickHouse数据盘单独挂载,元数据盘共享第一个数据盘目录。

  • 磁盘实际容量

    由于磁盘存在1MB = 1024KB或者1000KB的不同算法,一般来说,磁盘实际可用容量 = 磁盘标注容量 * 0.9。

    例如磁盘标注容量为1.2 TB,实际容量为1200 * 0.9 = 1080 GB。

  • 计算公式

    假设历史数据量为H,每日增量为A,单节点磁盘容量为C,数据保留M天,集群副本数为R,则ClickHouseServer物理节点数计算公式如下:

    ClickHouseServer物理节点数N = [R * (H + A * M)] / C