HyperLogLog
hll_default_log2m
参数说明:该参数可以指定hll数据结构桶的个数。桶的个数会影响hll计算distinct值的精度,桶的个数越多,误差越小。误差范围为:[-1.04/2log2m*1/2,+1.04/2log2m*1/2]。
参数类型:整型
参数单位:无
取值范围:10 ~ 16
默认值:14
设置方式:该参数属于USERSET类型参数,请参考表1中对应设置方法进行设置。
设置建议:推荐使用默认值,可以根据实际业务需要进行调整。
设置不当的风险与影响:设置过小可能导致无法达到所需的精度要求,而设置过大则可能导致资源浪费。
hll_default_log2explicit
参数说明:该参数可以用来设置从Explicit模式到Sparse模式的默认阈值大小。
参数类型:整型
参数单位:无
取值范围:0 ~ 12
- 0:表示跳过Explicit模式。
- 1 ~ 12:表示在基数到达2hll_default_log2explicit时切换模式。
默认值:10
设置方式:该参数属于USERSET类型参数,请参考表1中对应设置方法进行设置。
设置建议:推荐使用默认值,可以根据实际业务需要进行调整。
设置不当的风险与影响:设置过小可能导致无法达到所需的精度要求,而设置过大则可能导致资源浪费。
hll_default_log2sparse
参数说明:该参数可以用来设置从Sparse模式到Full模式的默认阈值大小。
参数类型:整型
参数单位:无
取值范围:0 ~ 14
- 0:表示跳过Explicit模式。
- 1~14:表示在基数到达2hll_default_log2sparse时切换模式。
默认值:12
设置方式:该参数属于USERSET类型参数,请参考表1中对应设置方法进行设置。
设置建议:推荐使用默认值,可以根据实际业务需要进行调整。
设置不当的风险与影响:设置过小可能导致无法达到所需的精度要求,而设置过大则可能导致资源浪费。
hll_duplicate_check
参数说明:该参数可以用来指定是否默认开启duplicatecheck。
参数类型:整型
参数单位:无
取值范围:0 ~ 1
- 0:表示默认关闭。
- 1:表示默认开启。
默认值:0
设置方式:该参数属于USERSET类型参数,请参考表1中对应设置方法进行设置。
设置建议:推荐使用默认值,可以根据实际业务需要进行调整。
设置不当的风险与影响:开启可能会消耗更多资源来进行duplicate check,但会提高distinct值计算的准确性。