最新动态
功能总览
服务公告
- 产品公告
- 产品发布说明
产品介绍
- 图解云数据库GaussDB
- 什么是云数据库GaussDB
- 应用场景
- 常用概念
- 产品优势
- 实例说明
- 数据库实例规格
- 数据库产品类型
- 安全
- 权限管理
- 约束与限制
- GaussDB与其他服务的关系
- 兼容性说明
计费说明
- 计费概述
- 计费项
- 计费模式
- 计费样例
- 变更计费模式
- 续费
- 费用账单
- 欠费说明
- 停止计费
- 成本管理
快速入门
- 购买并通过界面化工具DAS连接GaussDB实例（推荐）
- 购买并通过gsql连接GaussDB实例
- GaussDB入门实践
用户指南
- 权限管理
  - 创建用户并授权使用GaussDB
  - 自定义策略
- 购买GaussDB实例
- 连接GaussDB实例
  - GaussDB实例连接方式介绍
  - 通过数据管理服务DAS连接实例
  - 通过gsql连接实例
  - 通过Navicat连接实例
  - 通过DBeaver连接实例
- 数据库迁移
  - GaussDB迁移方案总览
  - 使用DRS将Oracle数据库迁移至GaussDB
  - 使用DRS将MySQL数据库迁移到GaussDB
  - 使用DAS的导出和导入功能迁移GaussDB数据
  - 使用copy to/from命令导出导入数据
  - JDBC中使用COPY命令导出导入数据
  - 使用gs_dump和gs_dumpall命令导出数据
  - 使用gs_restore命令导入数据
  - 使用gs_loader工具导入数据
- 使用数据库
  - 数据库使用概述
  - 创建GaussDB数据库
  - 创建GaussDB数据库用户
- 实例管理
  - 查看GaussDB实例总览
  - 设置GaussDB实例安全组规则
  - 绑定和解绑GaussDB实例弹性公网IP
  - 设置GaussDB实例回收站策略
  - 导出GaussDB实例列表
  - 退订GaussDB包周期实例
  - 停止GaussDB实例
  - 启动GaussDB实例
  - 重启GaussDB实例
  - 删除GaussDB按需实例
  - 重建GaussDB实例
  - 停止GaussDB节点
  - 启动GaussDB节点
  - 重启GaussDB节点
- 变更实例
  - 修改GaussDB实例名称
  - 修改GaussDB数据库端口
  - 修改M兼容端口
  - 变更GaussDB实例的CPU和内存规格
  - 只读节点变更
  - 同步数据至单副本实例
  - 查看并修改高级特性
  - 扩容和缩容实例
  - 扩容磁盘
  - 变更部署形态
  - DN主备倒换
- 版本升级
  - 版本升级概述
  - 热补丁升级
  - 就地升级
  - 灰度升级
- 插件管理
  - 插件安装
  - 开启或关闭插件开关
  - 查看拓展功能模块
- 数据备份
  - 备份概述
  - 执行备份
  - 管理备份
- 数据恢复
  - GaussDB数据误操作恢复方案
  - 通过备份文件恢复GaussDB实例
  - 通过备份文件恢复GaussDB库/表
  - 恢复GaussDB实例到指定时间点
  - 恢复GaussDB库/表到指定时间点
- 参数管理
  - 数据库实例支持修改的参数
  - 修改GaussDB实例参数
  - 查看GaussDB实例参数修改历史
  - 导出GaussDB实例参数
  - 创建GaussDB实例参数模板
  - 管理GaussDB实例参数模板
- 监控与告警
  - GaussDB支持的监控指标
  - 查看GaussDB监控指标
  - 查看GaussDB监控大盘
  - 创建GaussDB实例告警规则
  - 事件监控
- 日志与审计
  - 下载GaussDB错误日志和慢日志
  - 下载GaussDB强切日志
  - 在CTS查看GaussDB实例审计日志
  - 对接LTS并查看数据库审计日志
- 配额调整
  - 调整GaussDB云服务资源配额
  - 调整企业项目下的GaussDB资源配额
- SQL诊断
  - 配置SQL限流
- 容灾管理
  - 约束限制
  - 创建容灾任务
  - 查询容灾任务
  - 容灾升主
  - 结束容灾
  - 删除容灾任务
  - 主实例故障后重建灾备任务
  - 容灾主备关系切换
  - 容灾回切
  - 灾备实例容灾演练
  - 主实例日志保持
  - 灾备实例限制说明
- GaussDB任务管理
- GaussDB标签管理
- 重置GaussDB实例管理员密码
开发指南
- 开发指南（分布式_V2.0-8.x）
- 开发指南（集中式_V2.0-8.x）
- 开发指南（分布式_V2.0-3.x）
- 开发指南（集中式_V2.0-3.x）
- 开发指南（分布式_V2.0-2.x）
- 开发指南（集中式_V2.0-2.x）
工具参考
- 工具参考（分布式_V2.0-8.x）
- 工具参考（集中式_V2.0-8.x）
- 工具参考（分布式_V2.0-3.x）
- 工具参考（集中式_V2.0-3.x）
  - gsql
  - gs_loader
- 工具参考（分布式_V2.0-2.x）
- 工具参考（集中式_V2.0-2.x）
  - gsql
  - gs_loader
特性指南
- 特性指南（分布式_V2.0-8.x）
- 特性指南（集中式_V2.0-8.x）
- 特性指南（分布式_V2.0-3.x）
- 特性指南（集中式_V2.0-3.x）
最佳实践
- GaussDB安全配置建议
- 扩缩容最佳实践
性能白皮书
- 测试方法
- 测试数据
API参考
- 使用前必读
- API概览
- 如何调用API
- API（推荐）
- 历史API
- 权限策略和授权项
  - 策略及授权项说明
  - GaussDB授权分类
- 附录
SDK参考
- SDK概述
场景代码示例
常见问题
- 产品咨询
- GaussDB资源冻结/解冻/释放/删除/退订
- 资源及磁盘管理
- 数据库连接
- 数据库存储
  1. 数据超过了GaussDB实例的最大存储容量怎么办
  2. 如何查看GaussDB的存储空间使用情况
- 数据库基本使用
- 备份与恢复
- 数据库监控
  1. GaussDB实例的哪些监控指标需要重点关注
  2. GaussDB实例内存使用率指标的计算方法
- 扩容及规格变更
  1. GaussDB实例在扩容和规格变更期间是否一直可用
- 数据库参数修改
- 日志管理
  1. 如何查看GaussDB执行过的所有SQL日志
  2. 如何查看GaussDB数据库的死锁日志
- 网络安全
  1. 如何防止任意源连接GaussDB数据库
  2. 将根证书导入Windows/Linux操作系统
兼容性参考
- 与Oracle兼容性参考（分布式）
- 与Oracle兼容性参考（集中式）
- 与MySQL兼容性参考（分布式）
- 与MySQL兼容性参考（集中式）
视频帮助
文档下载
通用参考
- 产品术语
- 云服务等级协议（SLA）
- 白皮书资源
- 支持区域
- 系统权限

本文导读

展开导读

文档首页/ 云数据库 GaussDB/ 开发指南（分布式_V2.0-2.x）/ SQL调优指南/ 实际调优案例/ 案例：调整GUC参数best_agg_plan

案例：调整GUC参数best_agg_plan

更新时间：2024-11-01 GMT+08:00

现象描述

t1的表定义为：

    
       create table t1(a int, b int, c int) distribute by hash(a);

假设agg下层算子所输出结果集的分布列为setA，agg操作的group by列为setB，则在Stream框架下，Agg操作可以分为两个场景。

setA是setB的一个子集。

对于这种场景，直接对下层结果集进行汇聚的结果就是正确的汇聚结果，上层算子直接使用即可。如下图所示：

      
         openGauss=# explain select a, count(1) from t1 group by a;
 id |          operation           | E-rows | E-width | E-costs  
----+------------------------------+--------+---------+---------
  1 | ->  Streaming (type: GATHER) |     30 |       4 | 15.56   
  2 |    ->  HashAggregate         |     30 |       4 | 14.31   
  3 |       ->  Seq Scan on t1     |     30 |       4 | 14.14   
(3 rows)

setA不是setB的一个子集。

对于这种场景，Stream执行框架分为如下三种计划形态：

hashagg+gather(redistribute)+hashagg

redistribute+hashagg(+gather)

hashagg+redistribute+hashagg(+gather)

GaussDB提供了guc参数best_agg_plan来干预执行计划，强制其生成上述对应的执行计划，此参数取值范围为0，1，2，3

取值为1时，强制生成第一种计划。
取值为2时，如果group by列可以重分布，强制生成第二种计划，否则生成第一种计划。
取值为3时，如果group by列可以重分布，强制生成第三种计划，否则生成第一种计划。
取值为0时，优化器会根据以上三种计划的估算代价选择最优的一种计划生成。

具体影响请看下述图片

      
       
         
         openGauss=# set best_agg_plan to 1;
SET
openGauss=# explain select b,count(1) from t1 group by b;
 id |            operation            | E-rows | E-width | E-costs 
----+---------------------------------+--------+---------+---------
  1 | ->  HashAggregate               |      8 |       4 | 15.83   
  2 |    ->  Streaming (type: GATHER) |     25 |       4 | 15.83   
  3 |       ->  HashAggregate         |     25 |       4 | 14.33   
  4 |          ->  Seq Scan on t1     |     30 |       4 | 14.14   
(4 rows)
openGauss=# set best_agg_plan to 2;
SET
openGauss=# explain select b,count(1) from t1 group by b;
 id |                operation                | E-rows | E-width | E-costs 
----+-----------------------------------------+--------+---------+---------
  1 | ->  Streaming (type: GATHER)            |     30 |       4 | 15.85   
  2 |    ->  HashAggregate                    |     30 |       4 | 14.60   
  3 |       ->  Streaming(type: REDISTRIBUTE) |     30 |       4 | 14.45   
  4 |          ->  Seq Scan on t1             |     30 |       4 | 14.14   
(4 rows)
openGauss=# set best_agg_plan to 3;
SET
openGauss=# explain select b,count(1) from t1 group by b;
 id |                operation                | E-rows | E-width | E-costs 
----+-----------------------------------------+--------+---------+---------
  1 | ->  Streaming (type: GATHER)            |     30 |       4 | 15.84   
  2 |    ->  HashAggregate                    |     30 |       4 | 14.59   
  3 |       ->  Streaming(type: REDISTRIBUTE) |     25 |       4 | 14.59   
  4 |          ->  HashAggregate              |     25 |       4 | 14.33   
  5 |             ->  Seq Scan on t1          |     30 |       4 | 14.14   
(5 rows)

        

      
     

优化说明

通常优化器总会选择最优的执行计划，但是众所周知代价估算，尤其是中间结果集的代价估算一般会有比较大的偏差，这种比较大的偏差就可能会导致agg的计算方式出现比较大的偏差，这时候就需要通过best_agg_plan进行agg计算模型的干预。

一般来说，当agg汇聚的收敛度很小时，即结果集的个数在agg之后并没有明显变少时（经验上以5倍为临界点），选择redistribute+hashagg执行方式，否则选择hashagg+redistribute+hashagg执行方式。

父主题： 实际调优案例

上一篇：案例：改建分区表

下一篇：案例：改写SQL消除子查询

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

智能客服提问云社区提问

案例：调整GUC参数best_agg_plan

现象描述

优化说明

相关文档

意见反馈

文档内容是否对您有帮助？

7*24

备案

专业服务

退订

建议反馈

售前咨询热线

文档反馈