最新动态
功能总览
服务公告
- 产品公告
- 版本支持公告
产品介绍
- 图解数据仓库服务
- 什么是数据仓库服务
- 数据仓库类型
- 数据仓库规格
- 产品优势
- 应用场景
- 产品功能
- 基本概念
- 与其他云服务的关系
- 安全
- GaussDB(DWS)权限管理
- 如何访问GaussDB(DWS)
- 使用限制
- 技术支持
- 配额说明
- GaussDB(DWS)技术指标
计费说明
- GaussDB(DWS)计费概述
- 计费模式
- 计费项
- 计费样例
- 变更计费模式
- 续费
  - 续费概述
  - 手动续费
- 费用账单
- 欠费说明
- 停止计费
- 成本管理
- 计费FAQ
快速入门
- 免费体验GaussDB(DWS)
- 快速创建GaussDB(DWS)集群并导入数据进行查询
- GaussDB(DWS)数据开发SQL入门操作
- GaussDB(DWS)入门实践
用户指南
- GaussDB(DWS)使用流程
- 准备工作
- 创建GaussDB(DWS)集群
- 连接GaussDB(DWS)集群
- 创建GaussDB(DWS)数据库和用户
- 迁移业务数据至GaussDB(DWS)集群
  - 使用GDS-Kafka工具迁移数据至GaussDB(DWS)集群
  - 管理数据源
- GaussDB(DWS)集群数据安全与加密
- GaussDB(DWS)集群管理
- GaussDB(DWS)集群运维
最佳实践
- 导入导出
- 数据迁移
- 数据分析
- 存算分离
  - GaussDB(DWS) 3.0 存算分离使用建议及性能优化
- 数据开发
- 数据库管理
- 性能调优
  - 基于表结构设计和调优提升GaussDB(DWS)查询性能
  - 分析正在执行的SQL以处理GaussDB(DWS)业务阻塞
- 集群管理
  - 为两种作业绑定不同资源池以实现GaussDB(DWS)资源负载能力
  - GaussDB(DWS)存算一体架构弹性伸缩系统性介绍
数据迁移与同步
- 迁移数据到GaussDB(DWS)
- 导入数据
- 整库迁移
  - 使用CDM迁移数据到GaussDB(DWS)
  - 使用DSC工具迁移SQL脚本
- 实时入库
  - Kafka实时入库到GaussDB(DWS)
- 元数据迁移
  - 使用gs_dump和gs_dumpall命令导出元数据
  - 使用gs_restore导入数据
- 导出数据
- 其他操作
开发指南
- 标准数仓开发指南(9.1.0.x)
- 标准数仓开发指南(8.1.3.x)
- 实时数仓开发指南(9.1.0.x)
- 实时数仓开发指南(8.1.3.x)
- 历史版本
SQL语法参考
- SQL语法参考(9.1.0.x)
- SQL语法参考(8.1.3.x)
- 历史版本
工具指南
- 工具简介
- 工具下载
- gsql
- Data Studio
- GDS
- DSC
- DataCheck
- DWS-Connector
- 服务端工具
API参考
- 使用前必读
- API概述
- 如何调用API
- 快速入门
- API说明
- 应用示例
  - 使用Postman调用创建集群接口
  - 使用Postman调用创建快照接口
- 权限及授权项说明
- 附录
SDK参考
- SDK概述
场景代码示例
错误码参考
- 控制台错误码
  - 管理控制台错误码
- 错误码(8.2.0及以下版本)
  - 管理控制台错误码
  - 数据仓库错误码
- 8.2.1及以上版本
  - 错误码命名规范
  - 行列存
    - 行存
    - 列存
    - GIN索引
    - Btree索引
    - 行存vacuum
    - SP-GiST索引
    - Hash索引
  - 事务
    - 锁
    - GTM
    - xlog
    - checkpoint
  - HA
  - SQL on Anywhere
    - SQL on hudi
    - OBS / HDFS / DLI
  - GDS/Copy
    - 公共机制（选项参数、任务分配、压缩）
    - 导入
  - 解析器
    - 词法分析
    - 语法分析
    - DDL
    - DML
    - 表达式
    - 元数据
  - 优化器
  - 执行器
  - 安全
    - 授权
    - 脱敏
  - 通信
  - WLM
  - 逻辑集群
  - 其他
常见问题
- Top问题汇总
- 产品咨询
- 数据库连接
- 数据迁移
- 数据库使用
- 集群管理
- 账户与权限
- 数据库性能
- 备份恢复
  1. 为什么DWS自动快照创建很慢，很长时间都没有创建好？
  2. DWS快照是否与EVS快照功能相同？
故障排除
- 数据库连接管理
- JDBC/ODBC类
- 数据导入/导出
- 数据库参数修改
- 账号/权限/密码
- 集群性能
- 集群异常
  - 磁盘监控告警阈值太低，告警频繁
- 数据库使用
视频帮助
性能白皮书
- 性能白皮书(9.1.0.x)
- 性能白皮书(8.1.3.x)
文档下载
通用参考
- 产品术语
- 云服务等级协议（SLA）
- 白皮书资源
- 支持区域
- 系统权限

本文导读

展开导读

文档首页/ 数据仓库服务 GaussDB(DWS)/ SQL语法参考/ SQL语法参考(9.1.0.x)/ DML语法/ EXPLAIN

EXPLAIN

更新时间：2025-03-21 GMT+08:00

查看PDF

功能描述

显示SQL语句的执行计划。

执行计划将显示SQL语句所引用的表采用的扫描方式，如：简单的顺序扫描、索引扫描等。如果引用了多个表，执行计划还会显示使用的JOIN算法。

执行计划的最关键部分是语句的预计执行开销，即计划生成器估算执行该语句将花费多长的时间。

若指定了ANALYZE选项，则该语句会被执行，然后根据实际的运行结果显示统计数据，包括每个计划节点内时间总开销（毫秒为单位）和实际返回的总行数。这对于判断计划生成器是否接近现实非常有用。

注意事项

在指定ANALYZE选项时，语句会被执行。如果用户使用EXPLAIN分析INSERT，UPDATE，DELETE，CREATE TABLE AS或EXECUTE语句，但不改动数据（执行这些语句会影响数据），可使用以下方法：

    
       START TRANSACTION;
EXPLAIN ANALYZE ...;
ROLLBACK;

语法格式

显示SQL语句的执行计划，支持多种选项，对选项顺序无要求：

      
         EXPLAIN [ (  option  [, ...] )  ] statement;

其中选项option子句的语法为：

       
        
          
          ANALYZE [ boolean ] |
    ANALYSE [ boolean ] |
    VERBOSE [ boolean ] |
    COSTS [ boolean ] |
    CPU [ boolean ] |
    DETAIL [ boolean ] |
    NODES [ boolean ] |
    NUM_NODES [ boolean ] |
    BUFFERS [ boolean ] |
    TIMING [ boolean ] |
    PLAN [ boolean ] |
    FORMAT { TEXT | XML | JSON | YAML } |
    BLOCKNAME [boolean] |
    OUTLINE [boolean]  |
    WARMUP |
    WARMUP HOT

         

       
      

显示SQL语句的执行计划，且要按顺序给出选项：

      
         EXPLAIN  { [  { ANALYZE  | ANALYSE  }  ] [ VERBOSE  ]  | PERFORMANCE  } statement;

显示复现SQL语句的执行计划所需的信息，通常用于定位问题。STATS选项必须单独使用：
1

EXPLAIN ( STATS [ boolean ] ) statement;

显示DDL语句执行步骤的详细耗时信息。（该语法仅9.1.0及以上集群版本支持）
1

EXPLAIN PERFORMANCE statement;
支持的DDL语句有CREATE、CREATE INDEX、DROP、VACUUM FULL、ANALYZE及COPY。
执行预查询，并将用户预查询的数据缓存到本地磁盘，提升实际查询时的查询速度。（该语法仅9.1.0.200及以上集群版本支持）
1

EXPLAIN WARMUP statement;
1

EXPLAIN WARMUP HOT statement;

参数说明

表1 EXPLAIN参数说明
参数	描述	取值范围
statement	指定要分析的SQL语句。	-
ANALYZE boolean \| ANALYSE boolean	显示实际运行时间和其他统计数据。	TRUE：显示实际运行时间和其他统计数据。 FALSE：不显示。缺省值：TRUE
VERBOSE boolean	显示有关计划的额外信息。	TRUE：显示额外信息。 FALSE：不显示。缺省值：TRUE
COSTS boolean	包括每个规划节点的估计总成本，以及估计的行数和每行的宽度。	TRUE：显示估计总成本和宽度。 FALSE：不显示。缺省值：TRUE
CPU boolean	打印CPU的使用情况的信息。	TRUE：显示CPU的使用情况。 FALSE：不显示。缺省值：TRUE
DETAIL boolean	打印DN上的信息。说明： 8.2.1及以上集群版本支持explain打开Detail开关时，执行计划中会显示倾斜值比对耗时。	TRUE：打印DN的信息。 FALSE：不打印。缺省值：TRUE
NODES boolean	打印query执行的节点信息。	TRUE：打印执行的节点的信息。 FALSE：不打印。缺省值：TRUE
NUM_NODES boolean	打印执行中的节点的个数信息。	TRUE：打印DN个数的信息。 FALSE：不打印。缺省值：TRUE
BUFFERS boolean	包括缓冲区的使用情况的信息。	TRUE：显示缓冲区的使用情况。 FALSE：不显示。缺省值：FALSE
TIMING boolean	包括实际的启动时间和花费在输出节点上的时间信息。	TRUE：显示启动时间和花费在输出节点上的时间信息。 FALSE：不显示。缺省值：TRUE
PLAN	是否将执行计划存储在plan_table中。当该选项开启时，会将执行计划存储在PLAN_TABLE中，不打印到当前屏幕，因此该选项为on时，不能与其他选项同时使用。	ON：将执行计划存储在plan_table中，不打印到当前屏幕。执行成功返回EXPLAIN SUCCESS。 OFF：不存储执行计划，将执行计划打印到当前屏幕。缺省值：ON
FORMAT	指定输出格式。	支持四种格式：TEXT，XML，JSON和YAML。缺省值：TEXT
BLOCKNAME boolean	显示算子的blockname信息。说明：仅在explain_perf_mode取值为pretty时，打印blockname信息。	TRUE：显示blockname信息。 FALSE：不显示blockname信息。缺省值：TRUE
OUTLINE boolean	显示从计划中提取的outline信息。说明：仅在explain_perf_mode取值为pretty时，打印outline信息。	TRUE：显示outline信息。 FALSE：不显示outline信息。缺省值：TRUE
PERFORMANCE	使用此选项时，即打印执行中的所有相关信息。	-
STATS boolean	打印复现SQL语句的执行计划所需的信息，包括对象定义、统计信息、配置参数等，通常用于定位问题。	TRUE：显示复现SQL语句的执行计划所需的信息。 FALSE：不显示。缺省值：TRUE
WARMUP	warmup将查询数据按照A1in > A1out > Am的顺序进行。该参数仅9.1.0.200及以上集群版本支持。	-
WARMUP HOT	warmup hot将查询的数据直接加入am列。该参数仅9.1.0.200及以上集群版本支持。	-

示例

创建一个表tpcds.customer_address_p1：

    
       CREATE TABLE tpcds.customer_address_p1 AS TABLE tpcds.customer_address;

修改explain_perf_mode为normal：

    
       SET explain_perf_mode=normal;

显示表简单查询的执行计划：

    
       EXPLAIN SELECT * FROM tpcds.customer_address_p1;
			       QUERY PLAN
----------------------------------------------------------------------------
 Data Node Scan on "__REMOTE_FQS_QUERY__"  (cost=0.00..0.00 rows=0 width=0)
   Node/s: All datanodes
(2 rows)

以JSON格式输出的执行计划（explain_perf_mode为normal时）：

    
     
       
       EXPLAIN(FORMAT JSON) SELECT * FROM tpcds.customer_address_p1;
                    QUERY PLAN
---------------------------------------------------
 [                                                +
   {                                              +
     "Plan": {                                    +
       "Node Type": "Data Node Scan",             +
       "RemoteQuery name": "__REMOTE_FQS_QUERY__",+
       "Alias": "__REMOTE_FQS_QUERY__",           +
       "Startup Cost": 0.00,                      +
       "Total Cost": 0.00,                        +
       "Plan Rows": 0,                            +
       "Plan Width": 0,                           +
       "Nodes": "All datanodes"                   +
     }                                            +
   }                                              +
 ]
(1 row)

      

    
   

如果有一个索引，当使用一个带索引WHERE条件的查询，可能会显示一个不同的计划：

    
       EXPLAIN SELECT * FROM tpcds.customer_address_p1 WHERE ca_address_sk=10000;
                                  QUERY PLAN
------------------------------------------------------------------------------
 Data Node Scan on "__REMOTE_LIGHT_QUERY__"  (cost=0.00..0.00 rows=0 width=0)
   Node/s: datanode2
(2 rows)

以YAML格式输出的执行计划（explain_perf_mode为normal时）：

    
     
       
       EXPLAIN(FORMAT YAML) SELECT * FROM tpcds.customer_address_p1 WHERE ca_address_sk=10000;
                   QUERY PLAN
------------------------------------------------
 - Plan:                                       +
     Node Type: "Data Node Scan"               +
     RemoteQuery name: "__REMOTE_LIGHT_QUERY__"+
     Alias: "__REMOTE_LIGHT_QUERY__"           +
     Startup Cost: 0.00                        +
     Total Cost: 0.00                          +
     Plan Rows: 0                              +
     Plan Width: 0                             +
     Nodes: "datanode2"
(1 row)

      

    
   

禁止开销估计的执行计划：

    
       EXPLAIN(COSTS FALSE)SELECT * FROM tpcds.customer_address_p1 WHERE ca_address_sk=10000;
                 QUERY PLAN
--------------------------------------------
 Data Node Scan on "__REMOTE_LIGHT_QUERY__"
   Node/s: datanode2
(2 rows)

带有聚集函数查询的执行计划：

    
       EXPLAIN SELECT SUM(ca_address_sk) FROM tpcds.customer_address_p1 WHERE ca_address_sk<10000;
                                      QUERY PLAN                                       
---------------------------------------------------------------------------------------
 Aggregate  (cost=18.19..14.32 rows=1 width=4)
   ->  Streaming (type: GATHER)  (cost=18.19..14.32 rows=3 width=4)
         Node/s: All datanodes
         ->  Aggregate  (cost=14.19..14.20 rows=3 width=4)
               ->  Seq Scan on customer_address_p1  (cost=0.00..14.18 rows=10 width=4)
                     Filter: (ca_address_sk < 10000)
(6 rows)

删除表tpcds.customer_address_p1：

    
       DROP TABLE tpcds.customer_address_p1;

对ANALYZE语句执行EXPLAIN PERFORMANCE：

   
    
      
      EXPLAIN PERFORMANCE ANALYZE t2_dist_row;
                            QUERY EXEC INFO                            
-----------------------------------------------------------------------
 lock FirstCN: 
        coordinator1: actual time=0.240 loops=1
 estimate rows: actual time=[datanode3 0.000, datanode1 0.001]
        coordinator1: actual time=0.000 loops=1
        datanode1: actual time=0.001 loops=1
        datanode2: actual time=0.000 loops=1
        datanode3: actual time=0.000 loops=1
 sample rows: actual time=[datanode1 5.109, coordinator1 119.838]
        coordinator1: actual time=119.838 loops=1
        datanode1: actual time=5.109 loops=1
        datanode2: actual time=5.621 loops=1
        datanode3: actual time=5.342 loops=1
 fetch global stats: 
        coordinator1: actual time=8.501 loops=1
 calc stats: actual time=[datanode3 80.794, datanode2 109.155]
        coordinator1: actual time=97.452 loops=1
        datanode1: actual time=94.375 loops=1
        datanode2: actual time=109.155 loops=1
        datanode3: actual time=80.794 loops=1
 calc column stats: actual time=[datanode2 0.938, datanode3 9.811]
        coordinator1: actual time=5.162 loops=2
        datanode1: actual time=1.453 loops=2
        datanode2: actual time=0.938 loops=2
        datanode3: actual time=9.811 loops=2
 calc index stats: actual time=[datanode3 12.392, coordinator1 36.113]
        coordinator1: actual time=36.113 loops=1
        datanode1: actual time=15.933 loops=1
        datanode2: actual time=13.419 loops=1
        datanode3: actual time=12.392 loops=1
 calc expr stats: actual time=[datanode3 41.665, datanode2 78.442]
        coordinator1: actual time=55.608 loops=1
        datanode1: actual time=63.179 loops=1
        datanode2: actual time=78.442 loops=1
        datanode3: actual time=41.665 loops=1
 sync stats: 
        coordinator1: actual time=7.906 loops=1

 General Tracks
 CN build CN connection: 
        coordinator1: actual time=0.002 loops=1
 CN build DN connection: 
        coordinator1: actual time=0.070 loops=1
 -> execute ddl on other CN: 
        coordinator1: actual time=0.001 loops=1
 -> execute ddl on other DN: 
        coordinator1: actual time=0.000 loops=1
 Query Id: 72902018968225366
 Total runtime: 242.211 ms
(48 rows)

     

   
  

显示计划的blockname信息：

   
    
      
      EXPLAIN (BLOCKNAME ON) SELECT SUM(ca_address_sk) FROM tpcds.customer_address_p1 WHERE ca_address_sk<10000;
                                         QUERY PLAN
---------------------------------------------------------------------------------------------
  id |                  operation                   | E-rows | E-memory | E-width | E-costs
 ----+----------------------------------------------+--------+----------+---------+---------
   1 | ->  Aggregate                                |      1 |          |      12 | 16.14
   2 |    ->  Streaming (type: GATHER)              |      2 |          |      12 | 16.14
   3 |       ->  Aggregate                          |      2 | 1MB      |      12 | 10.14
   4 |          ->  Seq Scan on customer_address_p1 |      7 | 1MB      |       4 | 10.12

 Predicate Information (identified by plan id)
 ---------------------------------------------
   4 --Seq Scan on customer_address_p1
         Filter: (ca_address_sk < 10000)

 Query Block Name / Object Alias (identified by plan id)
 -------------------------------------------------------
   1 - sel$1
   4 - sel$1 / customer_address_p1@"sel$1"

   ====== Query Summary =====
 -------------------------------
 System available mem: 4710400KB
 Query Max mem: 4710400KB
 Query estimated mem: 2048KB
(22 rows)

     

   
  

显示计划的outline信息：

   
    
      
      EXPLAIN (OUTLINE ON) SELECT SUM(ca_address_sk) FROM tpcds.customer_address_p1 WHERE ca_address_sk<10000;
                                         QUERY PLAN
---------------------------------------------------------------------------------------------
  id |                  operation                   | E-rows | E-memory | E-width | E-costs
 ----+----------------------------------------------+--------+----------+---------+---------
   1 | ->  Aggregate                                |      1 |          |      12 | 16.14
   2 |    ->  Streaming (type: GATHER)              |      2 |          |      12 | 16.14
   3 |       ->  Aggregate                          |      2 | 1MB      |      12 | 10.14
   4 |          ->  Seq Scan on customer_address_p1 |      7 | 1MB      |       4 | 10.12

 Predicate Information (identified by plan id)
 ---------------------------------------------
   4 --Seq Scan on customer_address_p1
         Filter: (ca_address_sk < 10000)

                         Outline Data
 ------------------------------------------------------------
   /*+
       begin_outline_data
        TableScan(@"sel$1" tpcds.customer_address_p1@"sel$1")
       end_outline_data
   */

   ====== Query Summary =====
 -------------------------------
 System available mem: 4710400KB
 Query Max mem: 4710400KB
 Query estimated mem: 2048KB
(25 rows)

     

   
  

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

智能客服提问云社区提问

EXPLAIN

功能描述

注意事项

语法格式

参数说明

示例

相关链接

相关文档

意见反馈

文档内容是否对您有帮助？

7*24

备案

专业服务

退订

建议反馈

售前咨询热线

文档反馈