更新时间:2024-11-12 GMT+08:00
分享

HyperLogLog

hll_default_log2m

参数说明:该参数可以指定hll数据结构桶的个数。桶的个数会影响hll计算distinct值的精度,桶的个数越多,误差越小。误差范围为:[-1.04/2log2m*1/2,+1.04/2log2m*1/2]。

参数类型:整型

参数单位:

取值范围:10 ~ 16

默认值:14

设置方式:该参数属于USERSET类型参数,请参考表1中对应设置方法进行设置。

设置建议:推荐使用默认值,可以根据实际业务需要进行调整。

设置不当的风险与影响:设置过小可能导致无法达到所需的精度要求,而设置过大则可能导致资源浪费。

hll_default_log2explicit

参数说明:该参数可以用来设置从Explicit模式到Sparse模式的默认阈值大小。

参数类型:整型

参数单位:

取值范围:0 ~ 12

  • 0:表示跳过Explicit模式。
  • 1 ~ 12:表示在基数到达2hll_default_log2explicit时切换模式。

默认值:10

设置方式:该参数属于USERSET类型参数,请参考表1中对应设置方法进行设置。

设置建议:推荐使用默认值,可以根据实际业务需要进行调整。

设置不当的风险与影响:设置过小可能导致无法达到所需的精度要求,而设置过大则可能导致资源浪费。

hll_default_log2sparse

参数说明:该参数可以用来设置从Sparse模式到Full模式的默认阈值大小。

参数类型:整型

参数单位:

取值范围:0 ~ 14

  • 0:表示跳过Explicit模式。
  • 1~14:表示在基数到达2hll_default_log2sparse时切换模式。

默认值:12

设置方式:该参数属于USERSET类型参数,请参考表1中对应设置方法进行设置。

设置建议:推荐使用默认值,可以根据实际业务需要进行调整。

设置不当的风险与影响:设置过小可能导致无法达到所需的精度要求,而设置过大则可能导致资源浪费。

hll_duplicate_check

参数说明:该参数可以用来指定是否默认开启duplicatecheck。

参数类型:整型

参数单位:

取值范围:0 ~ 1

  • 0:表示默认关闭。
  • 1:表示默认开启。

默认值:0

设置方式:该参数属于USERSET类型参数,请参考表1中对应设置方法进行设置。

设置建议:推荐使用默认值,可以根据实际业务需要进行调整。

设置不当的风险与影响:开启可能会消耗更多资源来进行duplicate check,但会提高distinct值计算的准确性。

相关文档