云数据库 RDS for MySQL

 

云数据库 RDS for MySQL拥有即开即用、稳定可靠、安全运行、弹性伸缩、轻松管理、经济实用等特点,让您更加专注业务发展。

 
 

    数据库的优化 更多内容
  • 聚合算法优化

    聚合算法优化 操作场景 在Spark SQL中支持基于行哈希聚合算法,即使用快速聚合hashmap作为缓存,以提高聚合性能。hashmap替代了之前ColumnarBatch支持,从而避免拥有聚合表宽模式(大量key字段或value字段)时产生性能问题。 操作步骤 要启动

    来自:帮助中心

    查看更多 →

  • Datasource表优化

    true:支持,目前仅支持Hive表predicate下压。 false:不支持 true spark.sql.hive.filesourcePartitionFileCacheSize 启用内存中分区文件元数据缓存大小。 所有表共享一个可以使用指定num字节进行文件元数据缓存。 只有当“spark

    来自:帮助中心

    查看更多 →

  • Hive Join数据优化

    Join数据倾斜问题 执行任务时候,任务进度长时间维持在99%,这种现象叫数据倾斜。 数据倾斜是经常存在,因为有少量Reduce任务分配到数据量和其他Reduce差异过大,导致大部分Reduce都已完成任务,但少量Reduce任务还没完成情况。 解决数据倾斜问题,可通过设置“set

    来自:帮助中心

    查看更多 →

  • Hive SQL逻辑优化

    Hive SQL逻辑优化 操作场景 在Hive上执行SQL语句查询时,如果语句中存在“(a&b) or (a&c)”逻辑时,建议将逻辑改为“a & (b or c)”。 样例 假设条件a为“p_partkey = l_partkey”,优化前样例如下所示: select

    来自:帮助中心

    查看更多 →

  • Hive Group By语句优化

    By也同样存在数据倾斜问题,设置“hive.groupby.skewindata”为“true”,生成查询计划会有两个MapReduce Job,第一个JobMap输出结果会随机分布到Reduce中,每个Reduce做聚合操作,并输出结果,这样处理会使相同Group By

    来自:帮助中心

    查看更多 →

  • Hive SQL逻辑优化

    Hive SQL逻辑优化 操作场景 在Hive上执行SQL语句查询时,如果语句中存在“(a&b) or (a&c)”逻辑时,建议将逻辑改为“a & (b or c)”。 样例 假设条件a为“p_partkey = l_partkey”,优化前样例如下所示: select

    来自:帮助中心

    查看更多 →

  • Datasource表优化

    true:支持,目前仅支持Hive表predicate下压。 false:不支持 true spark.sql.hive.filesourcePartitionFileCacheSize 启用内存中分区文件元数据缓存大小。 所有表共享一个可以使用指定num字节进行文件元数据缓存。 只有当“spark

    来自:帮助中心

    查看更多 →

  • 基因查询优化器

    设置建议:推荐使用默认值。 设置不当风险与影响:设置较高可能会导致GEQO算法更快地集中在一些优秀计划上,而不是探索可行计划中多样性。这可能会减少算法找到全局最优解可能性,但可以加快找到可行较优解速度。 geqo_seed 参数说明:控制GEQO使用随机数生产器初始化值,用来从顺序

    来自:帮助中心

    查看更多 →

  • 优化器方法配置

    force:表示只要查询中不包含向量化引擎不支持类型或者表达式,则查询基表为行存表,强制将查询转换为向量化执行计划执行计算。在这种情况下,针对不同查询场景可能出现性能下降。 optimal:表示在force基础上,由优化器根据查询复杂度进行选择是否将查询语句转换为向量化执行计划,尽可能避免转换为向量化的执行计划后出现性能下降。

    来自:帮助中心

    查看更多 →

  • 优化器方法配置

    tream回表计划性能不一定是最优,对于查询语句Q2,由于包含limit 1条件,GSI非Stream回表计划性能依然是最优。 enable_material 参数说明:控制优化器对实体化使用。消除整个实体化是不可能,但是可以关闭这个参数以防止优化器插入实体节点。 参数类型:布尔型

    来自:帮助中心

    查看更多 →

  • 优化器开销常量

    置该参数会影响优化器对生成计划选择,部分场景下影响查询性能。若要更改,请谨慎操作,避免因误操作产生意料之外风险。 effective_cache_size 参数说明:设置优化器在一次单一查询中可用磁盘缓冲区有效大小。 设置这个参数,要考虑 GaussDB 共享缓冲区以及内

    来自:帮助中心

    查看更多 →

  • 其他优化器选项

    summary:是在pretty基础上增加了对打印信息分析。 run:在summary基础上,将统计信息输出到csv格式文件中,以便于进一步分析。 默认值:pretty pretty模式当前只支持包含stream算子计划,不支持下发语句到DN节点计划。因此显示格式会受en

    来自:帮助中心

    查看更多 →

  • 支持的数据库

    数据订阅是获取数据库中关键业务数据变化信息,并将其缓存并提供统一SDK接口,方便下游业务订阅、获取、并消费,其支持数据库和订阅数据类型如表25所示,更多数据订阅功能特性可参考数据订阅。 表25 数据库信息 数据库引擎 支持订阅数据类型 RDS for MySQL 5.6、5.7版本 数据更新

    来自:帮助中心

    查看更多 →

  • 优化数据倾斜场景下的Spark SQL性能

    数据量少Task在运行完成后,导致很多CPU空闲,造成CPU资源浪费。 通过如下配置项可开启自动进行数据倾斜处理功能,通过将Hash分桶后数据量很大、且超过数据倾斜阈值分桶拆散,变成多个task处理一个桶数据机制,提高CPU资源利用率,提高系统性能。 未产生倾斜数据,将采用原有方式进行分桶并运行。

    来自:帮助中心

    查看更多 →

  • 优化小文件场景下的Spark SQL性能

    在小文件场景下,您可以通过如下配置手动指定每个Task数据量(Split Size),确保不会产生过多Task,提高性能。 当SQL逻辑中不包含Shuffle操作时,设置此配置项,不会有明显性能提升。 配置描述 要启动小文件优化,在Spark客户端“spark-defaults.conf”配置文件中进行设置。

    来自:帮助中心

    查看更多 →

  • 优化HDFS DataNode RPC的服务质量

    优化HDFS DataNode RPC服务质量 配置场景 当客户端写入HDFS速度大于DataNode硬盘带宽时,硬盘带宽会被占满,导致DataNode失去响应。客户端只能通过取消或恢复通道进行规避,这会导致写入失败及不必要通道恢复操作。 本章节适用于 MRS 3.x及后续版本。

    来自:帮助中心

    查看更多 →

  • 优化HDFS DataNode RPC的服务质量

    优化HDFS DataNode RPC服务质量 配置场景 当客户端写入HDFS速度大于DataNode硬盘带宽时,硬盘带宽会被占满,导致DataNode失去响应。客户端只能通过取消或恢复通道进行规避,这会导致写入失败及不必要通道恢复操作。 本章节适用于MRS 3.x及后续版本。

    来自:帮助中心

    查看更多 →

  • 大数据优化与提升服务怎么收费的?

    大数据优化与提升服务怎么收费? 大数据优化与提升服务为一次性计费产品。 父主题: 关于服务购买

    来自:帮助中心

    查看更多 →

  • Kafka性能优化

    生产者发送消息时指定了消息Key,按照对应Key发送消息至对应分区,会导致分区间数据不均衡。 系统重新实现了分区分配策略,但策略逻辑有问题,会导致分区间数据不均衡。 Kafka扩容了Broker节点,新增节点没有分配分区,会导致节点间数据不均衡。 业务使用过程中随着集群状态变化,多少会发生一

    来自:帮助中心

    查看更多 →

  • Spark性能优化

    Spark作为内存计算引擎,需要更多内存和CPU。用户在规划规格时,应根据当前业务容量和增长速度,规划合理内存和CPU资源,特别需要关注以下几点: 当程序运行在yarn-client模式下时,需要关注在driver端汇聚数据量大小,根据自己业务场景,为driver设置合理内存。 根据自己业务目标

    来自:帮助中心

    查看更多 →

  • 基因查询优化器

    基因查询优化器 介绍基因查询优化器相关参数。基因查询优化器(GEQO)是一种启发式查询规划算法。这个算法减少了对复杂查询规划时间,而且生成规划开销有时也小于正常详尽查询算法。 geqo 参数说明:控制基因查询优化使用。 参数类型:USERSET 取值范围:布尔型 on表示使用。

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了