Agg

算子说明

Agg算子是用于执行聚集计算的算子, 支持3种策略处理：普通聚集（不分组只做聚集）、排序聚集和哈希聚集。排序聚集和哈希聚集因为涉及到分组，需要和group by搭配一起使用。排序聚集和哈希聚集的差别在于，排序聚集的输入必须是有序的，而哈希聚集则不关注输入的顺序性。必须说明即便是输入排好序的情况下，也不一定会选择排序聚集，因为哈希聚集可能会有更优的执行性能。

典型场景

普通聚集：只涉及到聚集计算，一般用于对表做总数统计，或者对某一列做行数或特性统计；在执行计划中体现是Aggregate关键字。
排序聚集：输入元组是已经排好序的，或分组键恰好是有序列，则可能会选择排序聚集；在执行计划中体现是GroupAggregate关键字。
哈希聚集：业务中目前涉及的大部分场景，以及数据无序情况下的聚集计算；在执行计划中体现是HashAggregate关键字。

示例

示例1：普通聚集。

--数据准备。 
gaussdb=# CREATE TABLE student(id integer, class_id integer, grade number); 
CREATE TABLE 
gaussdb=# INSERT INTO student VALUES(generate_series(1,50), 1, floor(100 * random())); 
INSERT 0 50 
gaussdb=# INSERT INTO student VALUES(generate_series(51,100), 2, floor(100 * random())); 
INSERT 0 50 
gaussdb=# INSERT INTO student VALUES(generate_series(101,150), 3, floor(100 * random())); 
INSERT 0 50 
gaussdb=# INSERT INTO student VALUES(generate_series(151,200), 3, floor(100 * random())); 
INSERT 0 50

--执行结果。 
gaussdb=# EXPLAIN SELECT count(*) FROM student; 
                           QUERY PLAN                             
----------------------------------------------------------------- 
 Aggregate  (cost=24.59..24.60 rows=1 width=8) 
   ->  Seq Scan on student  (cost=0.00..21.67 rows=1167 width=0) 
(2 rows)

示例2：排序聚集。

gaussdb=# SET enable_hashagg = off;
SET
gaussdb=# EXPLAIN SELECT id, count(class_id) FROM student GROUP BY id ORDER BY id; 
                             QUERY PLAN                               
--------------------------------------------------------------------- 
 GroupAggregate  (cost=10.64..14.14 rows=200 width=16) 
   Group By Key: id 
   ->  Sort  (cost=10.64..11.14 rows=200 width=8) 
         Sort Key: id 
         ->  Seq Scan on student  (cost=0.00..3.00 rows=200 width=8) 
(5 rows)

示例3：哈希聚集。

--执行结果。 
gaussdb=# SET enable_hashagg = on;
gaussdb=# EXPLAIN SELECT id, avg(grade) FROM student GROUP BY id; 
                            QUERY PLAN                             
------------------------------------------------------------------ 
 HashAggregate  (cost=27.51..30.01 rows=200 width=36) 
   Group By Key: id 
   ->  Seq Scan on student  (cost=0.00..21.67 rows=1167 width=36) 
(3 rows)

--删除。
gaussdb=# DROP TABLE student;

上述示例中，Agg算子输出信息如下所示。

信息名称	含义
Aggregate	普通的聚集算子名称，代表不分组只做聚集。
GroupAggregate	排序聚集算子名称，代表输入元组是已经排好序的，或分组键恰好是有序列。
HashAggregate	哈希聚集算子名称，大部分场景，以及数据无序情况下的聚集计算。

父主题： 运算符

上一篇：Append

下一篇：Group

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消