更新时间:2023-04-24 GMT+08:00
分享

分区设计

合理设置分区键,控制分区数在一千以内,分区字段使用整型。

分区part数与查询性能关系

图1 分区part数与查询性能关系图

分区建议

  • 建议使用toYYYYMMDD(pt_d)作为分区键,pt_d是date类型。
  • 如果业务场景需要做小时分区,使用pt_d、pt_h做联合分区键,其中pt_h是整型小时数。
  • 如果保存多年数据,建议考虑使用月做分区,toYYYYMM(pt_d)。
  • 综合考虑数据分区粒度、每个批次提交的数据量、数据的保存周期等因素,合理控制part数量。
分享:

    相关文档

    相关产品