更新时间:2024-12-11 GMT+08:00
ClickHouse分区设计
合理设置分区键,控制分区数在一千以内,分区字段使用整型。
分区part数与查询性能关系
图1 分区part数与查询性能关系图
分区建议
- 建议使用toYYYYMMDD(pt_d)作为分区键,pt_d是date类型。
- 如果业务场景需要做小时分区,使用pt_d、pt_h做联合分区键,其中pt_h是整型小时数。
- 如果保存多年数据,建议考虑使用月做分区,toYYYYMM(pt_d)。
- 综合考虑数据分区粒度、每个批次提交的数据量、数据的保存周期等因素,合理控制part数量。
父主题: ClickHouse宽表设计