数据仓库服务 GaussDB(DWS)

 

GaussDB(DWS)是一款具备分析及混合负载能力的分布式数据库,支持x86和Kunpeng硬件架构,支持行存储与列存储,提供GB~PB级数据分析能力、多模分析和实时处理能力,用于数据仓库、数据集市、实时分析、实时决策和混合负载等场景,广泛应用于汽车、制造、零售、物流、互联网、金融、政府、电信等行业分析决策系统

 
 

    数据分析优化 更多内容
  • 基因查询优化器

    基因查询优化器 介绍基因查询优化器相关的参数。基因查询优化器(GEQO)是一种启发式的查询规划算法。这个算法减少了对复杂查询规划的时间,而且生成规划的开销有时也小于正常的详尽的查询算法。 geqo 参数说明:控制基因查询优化的使用。 参数类型:USERSET 取值范围:布尔型 on表示使用。

    来自:帮助中心

    查看更多 →

  • 查询分子优化任务

    查询分子优化任务 功能介绍 通过分子优化任务ID查询分子优化任务状态及结果。 URI GET /v1/{project_id}/task/optimization/{task_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 华为云项目id

    来自:帮助中心

    查看更多 →

  • Hive Group By语句优化

    Hive Group By语句优化 操作场景 优化Group by语句,可提升命令执行速度和查询速度。 Group by的时候, Map端会先进行分组, 分组完后分发到Reduce端, Reduce端再进行分组。可采用Map端聚合的方式来进行Group by优化,开启Map端初步聚合,减少Map的输出数据量。

    来自:帮助中心

    查看更多 →

  • Hive SQL逻辑优化

    Hive SQL逻辑优化 操作场景 在Hive上执行SQL语句查询时,如果语句中存在“(a&b) or (a&c)”逻辑时,建议将逻辑改为“a & (b or c)”。 样例 假设条件a为“p_partkey = l_partkey”,优化前样例如下所示: select

    来自:帮助中心

    查看更多 →

  • Hive SQL逻辑优化

    Hive SQL逻辑优化 操作场景 在Hive上执行SQL语句查询时,如果语句中存在“(a&b) or (a&c)”逻辑时,建议将逻辑改为“a & (b or c)”。 样例 假设条件a为“p_partkey = l_partkey”,优化前样例如下所示: select

    来自:帮助中心

    查看更多 →

  • Hive Join数据优化

    Hive Join数据优化 操作场景 使用Join语句时,如果数据量大,可能造成命令执行速度和查询速度慢,此时可进行Join优化。 Join优化可分为以下方式: Map Join Sort Merge Bucket Map Join Join顺序优化 Map Join Hive的Map

    来自:帮助中心

    查看更多 →

  • Datasource表优化

    Datasource表优化 操作场景 将datasource表的分区消息存储到Metastore中,并在Metastore中对分区消息进行处理。 优化datasource表,支持对表中分区执行增加、删除和修改等语法,从而增加与Hive的兼容性。 支持在查询语句中,把分区裁剪并下压

    来自:帮助中心

    查看更多 →

  • 聚合算法优化

    要启动聚合算法优化,在Spark客户端的“spark-defaults.conf”配置文件中进行设置。 表1 参数介绍 参数 描述 默认值 spark.sql.codegen.aggregate.map.twolevel.enabled 是否开启聚合算法优化: true:开启 false:不开启

    来自:帮助中心

    查看更多 →

  • Datasource表优化

    Datasource表优化 操作场景 将datasource表的分区消息存储到Metastore中,并在Metastore中对分区消息进行处理。 优化datasource表,支持对表中分区执行增加、删除和修改等语法,从而增加与Hive的兼容性。 支持在查询语句中,把分区裁剪并下压

    来自:帮助中心

    查看更多 →

  • 其他优化器选项

    enable_codegen 参数说明:标识是否允许开启代码生成优化,目前代码生成使用的是LLVM优化。 参数类型:USERSET 取值范围:布尔型 on表示允许开启代码生成优化。 off表示不允许开启代码生成优化。 目前LLVM优化仅支持向量化执行引擎特性和SQL on Hadoop特性,在其他场景下建议关闭此参数。

    来自:帮助中心

    查看更多 →

  • 优化器开销常量

    优化器开销常量 介绍优化器开销常量。这里描述的开销可以按照任意标准度量。只关心其相对值,因此以相同的系数缩放它们将不会对优化器的选择产生任何影响。缺省时,它们以抓取顺序页的开销为基本单位。也就是说将seq_page_cost设为1.0,同时其他开销参数以它为基准设置。也可以使用其他基准,比如以毫秒计的实际执行时间。

    来自:帮助中心

    查看更多 →

  • 基因查询优化器

    基因查询优化器 介绍基因查询优化器相关的参数。基因查询优化器(GEQO)是一种启发式的查询规划算法。这个算法减少了对复杂查询规划的时间,而且生成规划的开销有时也小于正常的详尽的查询算法。 geqo 参数说明:控制基因查询优化的使用。 该参数属于USERSET类型参数,请参考表1中对应设置方法进行设置。

    来自:帮助中心

    查看更多 →

  • 自动模型优化(AutoSearch)

    自动模型优化(AutoSearch) 超参搜索简介 搜索算法 创建超参搜索作业

    来自:帮助中心

    查看更多 →

  • 优化器开销常量

    优化器开销常量 介绍优化器开销常量。这里描述的开销可以按照任意标准度量。只关心其相对值,因此以相同的系数缩放它们将不会对优化器的选择产生任何影响。缺省时,以抓取顺序页的开销为基本单位。也就是说将seq_page_cost设为1.0,同时其他开销参数以他为基准设置。也可以使用其他基准,比如以毫秒计的实际执行时间。

    来自:帮助中心

    查看更多 →

  • 优化器方法配置

    优化器方法配置 这些配置参数提供了影响查询优化器选择查询规划的原始方法。如果优化器为特定的查询选择的缺省规划并不是最优的,可以通过使用这些配置参数强制优化器选择一个不同的规划来临时解决这个问题。更好地方法包括调节优化器开销常量、手动运行ANALYZE、增加配置参数default_

    来自:帮助中心

    查看更多 →

  • 成本优化支柱简介

    成本优化支柱简介 成本优化支柱专注于帮助企业高效地使用云服务来构建工作负载,面向工作负载的整个生命周期不断完善和改进,减少不必要的开支并提升运营效率,让云上应用始终最具成本效益。 成本优化实践不意味着只有降本,它是安全合规、韧性等维度的平衡,也是达成业务目标的最优投入。 华为公司

    来自:帮助中心

    查看更多 →

  • 大规格实例优化

    大规格实例优化 当网格内实例规模持续增大时,会引起Istio控制面组件Istiod和数据面组件Envoy的内存飙升问题。在购买网格时,可以为网格启用Mantis插件来解决此问题。 大规格实例优化特性仅在“华东-上海一”区域开放。 Mantis插件介绍 Mantis致力于解决由网格

    来自:帮助中心

    查看更多 →

  • 数据分析常见问题

    数据分析常见问题 数据源常见问题 管道作业常见问题 实时分析常见问题 时序分析常见问题 资产建模和分析常见问题

    来自:帮助中心

    查看更多 →

  • 性能优化类

    性能优化 MRS 集群是否支持重装系统? MRS集群是否支持切换操作系统? 如何提高集群Core节点的资源使用率? 如何关闭防火墙服务?

    来自:帮助中心

    查看更多 →

  • 优化集群性能

    优化集群性能 写入性能优化 查询性能优化

    来自:帮助中心

    查看更多 →

  • 其他相关参数优化

    其他相关参数优化 开启上述导入性能增强的优化后,索引merge任务会相应增加,可以通过调整如下配置降低merge任务开销对导入性能的影响: 通过指定配置项“index.merge.scheduler.max_thread_count”,增加shard的合并线程数,减少合并对数据导入的限流。默认为4,建议设置为8。

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了