更新时间:2024-06-03 GMT+08:00

CREATE AGGREGATE

功能描述

创建一个新的聚集函数。

语法格式

CREATE AGGREGATE name ( input_data_type [ , ... ] ) (
    SFUNC = sfunc,
    -- SFUNC1 = sfunc, // 较早的写法,与SFUNC = sfunc等效
    STYPE = state_data_type
    -- STYPE1 = state_data_type, // 较早的写法,与STYPE = state_data_type等效
    [ , FINALFUNC = ffunc ]
    [ , INITCOND = initial_condition ]
    -- [ , INITCOND1 = initial_condition ] // 较早的写法,与INITCOND = initial_condition等效
    [ , SORTOP = sort_operator ]
    [ , CFUNC = collection_func ]
    [ , INITCOLLECT = initial_collection_condition ]
    [ , IFUNC = init_func ]
    [ , SHIPPABLE = is_shippable ]
);

也可使用:

CREATE AGGREGATE name (
    BASETYPE = base_type,
    SFUNC = sfunc,
    -- SFUNC1 = sfunc, // 较早的写法,与SFUNC = sfunc等效
    STYPE = state_data_type
    -- STYPE1 = state_data_type, // 较早的写法,与STYPE = state_data_type等效
    [ , FINALFUNC = ffunc ]
    [ , INITCOND = initial_condition ]
    -- [ , INITCOND1 = initial_condition ] // 较早的写法,与INITCOND = initial_condition等效
    [ , SORTOP = sort_operator ]
    [ , CFUNC = collection_func ]
    [ , INITCOLLECT = initial_collection_condition ]
    [ , IFUNC = init_func ]
);

参数说明

  • name

    要创建的聚集函数名(可以有模式修饰))。

  • input_data_type

    该聚集函数要处理的输入数据类型。要创建一个零参数聚集函数,可以使用*代替输入数据类型列表。(count(*)就是这种聚集函数的一个实例。)

  • base_type

    在CREATE AGGREGATE语法中,输入数据类型是通过basetype参数指定的,而不是写在聚集函数的名称之后。需要注意的是这种语法仅允许一个输入参数。要创建一个零参数聚集函数,可以将basetype指定为ANY,而不是*。

  • sfunc

    将在每一个输入行上调用的状态转换函数的名称。 对于有N个参数的聚合函数,sfunc必须有+1个参数,其中的第一个参数类型为state_data_type,其余的匹配已声明的输入数据类型。 函数必须返回一个state_data_type类型的值。 这个函数接受当前状态值和当前输入数据,并返回下个状态值。ORA数据库的转换函数默认行为为strict,即会跳过null输入值。GaussDB需要用户自行定义转换函数strict属性。不支持用户自定义的C语言函数。

  • state_data_type

    聚合的状态值的数据类型。

  • ffunc

    在转换完所有输入行后调用的最终处理函数,它计算聚合的结果。 此函数必须接受一个类型为state_data_type的参数。 聚合的输出数据类型被定义为此函数的返回类型。 如果没有声明ffunc则使用聚合结果的状态值作为聚合的结果,且输出类型为state_data_type。不支持用户自定义的C语言函数。

  • initial_condition

    状态值的初始设置(值)。 它必须是一个state_data_type类型可以接受的文本常量值。 如果没有声明,状态值初始为null。

  • sort_operator

    用于MIN或MAX类型聚合的排序操作符。 这个只是一个操作符名(可以有模式修饰)。这个操作符假设接受和聚合一样的输入数据类型。

  • collection_func

    如果希望分布式聚合来提高性能,用户可以提供collection_func。collection_func本质上是组合不同Datanode产生的状态转换结果。如果没有最终函数,collection_func产生的结果就是聚合的结果。如果需要collection_func跳过null值,请将collection_func标记为strict函数。如果没有标记为strict,用户需要妥善处理好null值输入。collection_func必须有两个类型为state_data_type的入参。第一个入参state_data_type将传给下一次collection_func执行的第一个参数。如果is_shippable为false,则不会执行collection_func。不支持用户自定义的C语言函数。

  • initial_collection_condition

    collection_func状态值的初始设置(值)。 它必须是一个state_data_type类型可以接受的文本常量值。 如果没有声明,状态值初始为null。

  • init_func

    sfunc状态值的初始设置函数。 它不能返回null值,必须返回state_data_type类型并且没有入参。如果同时设置init_func和initial_condition,init_func的返回值将会优先作为初始状态值。不支持用户自定义的C语言函数。

  • is_shippable

    标记该聚集函数是否能够下推执行,仅可以取值true或者false。目前该参数不影响系统内置聚集函数的下推行为,仅影响用户自定义聚集函数的行为,默认值为false。仅当存在collection_func且is_shippable为true时,用户自定义聚集可以下推。

示例

--创建自定义函数。
gaussdb=# CREATE OR REPLACE FUNCTION int_add(int,int)
	returns int as $BODY$
declare
begin
	return $1 + $2;
end;
$BODY$ language plpgsql;

--创建聚集函数。
gaussdb=# CREATE AGGREGATE sum_add(int)
(
    sfunc = int_add,
    
    stype = int,
    
    initcond = '0'
    
);

--创建测试表和添加数据。
gaussdb=# CREATE TABLE test_sum(a int,b int,c int);
gaussdb=# INSERT INTO test_sum VALUES(1,2),(2,3),(3,4),(4,5);

--执行聚集函数。
gaussdb=# SELECT sum_add(a) FROM test_sum;
   sum_add
-----------
   10

--删除聚集函数。
gaussdb=# DROP AGGREGATE sum_add(int);

--删除自定义函数。
gaussdb=# DROP FUNCTION int_add(int,int);

--删除测试表。
gaussdb=# DROP TABLE test_sum;