更新时间:2023-11-03 GMT+08:00

聚合函数概览

DLI所支持的聚合函数如聚合函数表所示。

表1 聚合函数表

函数

命令格式

返回值

功能简介

avg

avg(col), avg(DISTINCT col)

DOUBLE

求平均值。

corr

corr(col1, col2)

DOUBLE

返回两列数值的相关系数。

count

count([distinct|all] <colname>)

BIGINT

返回记录条数。

covar_pop

covar_pop(col1, col2)

DOUBLE

返回两列数值协方差。

covar_samp

covar_samp(col1, col2)

DOUBLE

返回两列数值样本协方差。

max

max(col)

DOUBLE

返回最大值。

min

min(col)

DOUBLE

返回最小值。

percentile

percentile(BIGINT col, p)

DOUBLE

返回数值区域的百分比数值点。0<=P<=1,否则返回NULL,不支持浮点型数值。

percentile_approx

percentile_approx(DOUBLE col, p [, B])

DOUBLE

返回组内数字列近似的第p位百分数(包括浮点数),p值在[0,1]之间。参数B控制近似的精确度,B值越大,近似度越高,默认值为10000。当列中非重复值的数量小于B时,返回精确的百分数。

stddev_pop

stddev_pop(col)

DOUBLE

返回指定列的偏差。

stddev_samp

stddev_samp(col)

DOUBLE

返回指定列的样本偏差。

sum

sum(col), sum(DISTINCT col)

DOUBLE

求和。

variance/var_pop

variance(col), var_pop(col)

DOUBLE

返回列的方差。

var_samp

var_samp(col)

DOUBLE

返回指定列的样本方差。