数据仓库服务 GaussDB(DWS)

 

GaussDB(DWS)是一款具备分析及混合负载能力的分布式数据库,支持x86和Kunpeng硬件架构,支持行存储与列存储,提供GB~PB级数据分析能力、多模分析和实时处理能力,用于数据仓库、数据集市、实时分析、实时决策和混合负载等场景,广泛应用于汽车、制造、零售、物流、互联网、金融、政府、电信等行业分析决策系统

 
 

    数据仓库事实表的分区 更多内容
  • 分区表静态剪枝

    ,包含任意分区键子集即可。 静态剪枝支持范围如下所示: 支持分区类型:范围分区、哈希分区、列分区。 支持达式类型:比较达式(<,<=,=,>=,>)、逻辑达式、数组达式。 目前静态剪枝不支持子查询达式。 为了支持分区剪枝,在计划生成时会将分区键上过滤条件强制转换

    来自:帮助中心

    查看更多 →

  • 分区表查询优化

    分区查询优化 本小节示例对应explain_perf_mode参数值为normal。 分区剪枝 分区算子执行优化 分区索引 父主题分区

    来自:帮助中心

    查看更多 →

  • 分区表查询优化

    分区查询优化 本节示例对应explain_perf_mode参数值为normal。 分区剪枝 分区算子执行优化 分区索引 分区统计信息 父主题分区

    来自:帮助中心

    查看更多 →

  • 分区表静态剪枝

    分区,包含任意分区键子集即可。 静态剪枝支持范围如下所示: 支持分区类型:范围分区、哈希分区、列分区。 支持达式类型:比较达式(<,<=,=,>=,>)、逻辑达式、数组达式。 目前静态剪枝不支持子查询达式。 为了支持分区剪枝,在计划生成时会将分区键上过滤条件强制

    来自:帮助中心

    查看更多 →

  • 分区表动态剪枝

    分区动态剪枝 对于检索条件中存在带有变量分区查询语句,由于优化器阶段无法获取用户绑定参数,因此优化器阶段仅能完成indexscan、bitmapindexscan、indexonlyscan等算子检索条件解析,后续会在执行器阶段获得绑定参数后,完成分区筛选。算子包含

    来自:帮助中心

    查看更多 →

  • 分区表行迁移

    如果业务明确不允许对分区键所在列进行更新操作,建议关闭分区行迁移。 例如,创建列分区,并开启分区行迁移,此时可以跨分区更新分区键所在列;关闭分区行迁移后,对分区键所在列进行跨分区更新会业务报错。 CREATE TABLE list_sales ( product_id INT4 NOT

    来自:帮助中心

    查看更多 →

  • 案例:改建分区表

    案例:改建分区 逻辑上一张根据某种策略分成多个物理块进行存储,这张逻辑上称之为分区,每个物理块则称为一个分区。一般对数据和查询都有明显区间段特征使用分区策略可通过较小不必要数据扫描,从而提升查询性能 在查询时,可通过分区剪枝技术尽可能减少底层数据扫描,即缩小扫描范

    来自:帮助中心

    查看更多 →

  • 分区表动态剪枝

    分区动态剪枝 对于检索条件中存在带有变量分区查询语句,由于优化器阶段无法获取用户绑定参数,因此优化器阶段仅能完成indexscan、bitmapindexscan、indexonlyscan等算子检索条件解析,后续会在执行器阶段获得绑定参数后,完成分区筛选。算子包含

    来自:帮助中心

    查看更多 →

  • 查看指定表所有分区

    起来。 partition_specs 分区信息,key=value形式,key为分区字段,value为分区值。若分区字段为多个字段,可以不包含所有的字段,会显示匹配上所有分区信息。 注意事项 所要查看分区必须存在且是分区,否则会出错。 示例 查看student下面的所有的分区。

    来自:帮助中心

    查看更多 →

  • 分区表DQL/DML

    分区DQL/DML 由于分区实现完全体现在数据库内核中,用户对分区DQL/DML与非分区相比,在语法上没有任何区别。 出于分区易用性考虑, GaussDB 支持指定分区DQL/DML操作,指定分区可以通过PARTITION (partname)或者PARTITION FOR

    来自:帮助中心

    查看更多 →

  • 分区表行迁移

    如果业务明确不允许对分区键所在列进行更新操作,建议关闭分区行迁移。 例如,创建列分区,并开启分区行迁移,此时可以跨分区更新分区键所在列;关闭分区行迁移后,对分区键所在列进行跨分区更新会业务报错。 CREATE TABLE list_sales ( product_id INT4 NOT

    来自:帮助中心

    查看更多 →

  • 分区表查询优化

    分区查询优化 本节示例对应explain_perf_mode参数值为normal。 分区剪枝 分区索引 分区统计信息 父主题分区

    来自:帮助中心

    查看更多 →

  • 案例:改建分区表

    runtime: 3.587 ms (4 rows) 优化分析 从业务层确认数据(在time字段上)有明显日期特征,符合分区特征。重新规划normal_date定义:字段time为分区键、月为间隔单位定义分区normal_date_part。修改后结果如下,性能提升近10倍。

    来自:帮助中心

    查看更多 →

  • 案例:改建分区表

    案例:改建分区 逻辑上一张根据某种策略分成多个物理块进行存储,这张逻辑上称之为分区,每个物理块则称为一个分区。一般对数据和查询都有明显区间段特征使用分区策略可通过较小不必要数据扫描,从而提升查询性能 在查询时,可通过分区剪枝技术尽可能减少底层数据扫描,即缩小扫描范

    来自:帮助中心

    查看更多 →

  • 查看指定表所有分区

    起来。 partition_specs 分区信息,key=value形式,key为分区字段,value为分区值。若分区字段为多个字段,可以不包含所有的字段,会显示匹配上所有分区信息。 注意事项 所要查看分区必须存在且是分区,否则会出错。 示例 查看student下面的所有的分区。

    来自:帮助中心

    查看更多 →

  • 案例:改建分区表

    案例:改建分区 现象描述 如下简单SQL语句查询, 性能瓶颈点在dwcjkScan上。 优化分析 从业务层确认数据(在cjrq字段上)有明显日期特征,符合分区特征。重新规划dwcjk定义:字段cjrq为分区键、天为间隔单位定义分区dwcjk_part。修改后结果如下,性能提升近1倍。

    来自:帮助中心

    查看更多 →

  • 获取数据仓库列表信息

    获取 数据仓库 信息 功能介绍 获取数据仓库 URI GET /v1.0/{project_id}/common/warehouses 1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目id,获取方法请参见获取项目ID 2 Query参数

    来自:帮助中心

    查看更多 →

  • 配置过滤掉分区表中路径不存在的分区

    verifyPartitionPath 配置读取HIVE分区时,是否过滤掉分区分区路径不存在分区。 “true”:过滤掉分区路径不存在分区; “false”:不进行过滤。 false 在spark-submit命令提交应用时,通过“--conf”参数配置是否过滤掉分区分区路径不存在分区。 示例: spark-submit

    来自:帮助中心

    查看更多 →

  • 配置过滤掉分区表中路径不存在的分区

    verifyPartitionPath 配置读取Hive分区时,是否过滤掉分区分区路径不存在分区。 “true”:过滤掉分区路径不存在分区; “false”:不进行过滤。 false 在spark-submit命令提交应用时,通过“--conf”参数配置是否过滤掉分区分区路径不存在分区。 示例: spark-submit

    来自:帮助中心

    查看更多 →

  • 分区表对导入操作的性能影响

    分区对导入操作性能影响 在GaussDB内核实现中,分区数据插入处理过程相比非分区增加分区路由部分开销,因从整体上分区场景数据插入开销主要看成:(1)heap-insert基插入、(2)partition-routing分区路由两个部分,其中heap基插入解

    来自:帮助中心

    查看更多 →

  • 分区表对导入操作的性能影响

    分区路由的主要处理逻辑根据导入数据元组分区键计算其所在分区过程,相比非分区这部分为额外增加开销,这部分开销在最终数据导入上具体性能损失和 服务器 CPU处理能力、宽度、磁盘/内存实际容量相关,通常可以粗略认为: x86服务器场景下一级分区相比普通导入性能会略低10%以内,二级分区比普通略低20%以内。

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了