中软国际数据治理专业服务解决方案实践

中软国际数据治理专业服务解决方案实践

    优化大数据生态圈 更多内容
  • 大规格实例优化

    规格实例优化 当网格内实例规模持续增大时,会引起Istio控制面组件Istiod和数据面组件Envoy的内存飙升问题。在购买网格时,可以为网格启用Mantis插件来解决此问题。 规格实例优化特性仅在“华东-上海一”区域开放。 Mantis插件介绍 Mantis致力于解决由网格

    来自:帮助中心

    查看更多 →

  • 数据优化

    数据优化 根据统计结果,双方可能会发现存在以下两个问题: 碰撞后的数据总数比较小。 碰撞后的数据分布不太均衡,负样本的比例过高。 这种情况下双方可以重复2-5的步骤更新自己提供的数据,多次执行样本分布统计直至达到比较满意的碰撞结果和分布结果。 至此联邦建模的数据准备阶段完成,接下来就是使用准备好的数据进行联邦建模。

    来自:帮助中心

    查看更多 →

  • Hive Join数据优化

    Cache中按桶一个一个读取小表内容,然后与表做匹配直接得到结果并输出。 Join顺序优化 当有3张及以上的表进行Join时,选择不同的Join顺序,执行时间存在较大差异。使用恰当的Join顺序可以有效缩短任务执行时间。 Join顺序原则: Join出来结果较小的组合,例如表数据量小或两张表Join后产生结果较少,优先执行。

    来自:帮助中心

    查看更多 →

  • Hive Join数据优化

    Cache中按桶一个一个读取小表内容,然后与表做匹配直接得到结果并输出。 Join顺序优化 当有3张及以上的表进行Join时,选择不同的Join顺序,执行时间存在较大差异。使用恰当的Join顺序可以有效缩短任务执行时间。 Join顺序原则: Join出来结果较小的组合,例如表数据量小或两张表Join后产生结果较少,优先执行。

    来自:帮助中心

    查看更多 →

  • Hive ORC数据存储优化

    Hive ORC数据存储优化 操作场景 “ORC”是一种高效的列存储格式,在压缩比和读取效率上优于其他文件格式。 建议使用“ORC”作为Hive表默认的存储格式。 前提条件 已登录Hive客户端,具体操作请参见Hive客户端使用实践。 操作步骤 推荐:使用“SNAPPY”压缩,适用于压缩比和读取效率要求均衡场景。

    来自:帮助中心

    查看更多 →

  • 数据分区查找优化

    分区扫描。当表内的数据量很大同时具有很长的历史周期时,由于扫描数据缩减所带来的性能提升会有明显的效果,如图2所示。 图1 分区表示例图 图2 分区表剪枝示例图 父主题: 容量数据

    来自:帮助中心

    查看更多 →

  • 数据分区查找优化

    分区扫描。当表内的数据量很大同时具有很长的历史周期时,由于扫描数据缩减所带来的性能提升会有明显的效果,如图2所示。 图1 分区表示例图 图2 分区表剪枝示例图 父主题: 容量数据

    来自:帮助中心

    查看更多 →

  • Hive ORC数据存储优化

    Hive ORC数据存储优化 操作场景 “ORC”是一种高效的列存储格式,在压缩比和读取效率上优于其他文件格式。 建议使用“ORC”作为Hive表默认的存储格式。 前提条件 已登录Hive客户端,具体操作请参见Hive客户端使用实践。 操作步骤 推荐:使用“SNAPPY”压缩,适用于压缩比和读取效率要求均衡场景。

    来自:帮助中心

    查看更多 →

  • 大数据性能优化

    数据性能优化 HIVE优化 Spark性能优化 Flink性能优化 父主题: 云服务性能优化介绍

    来自:帮助中心

    查看更多 →

  • 数据分区查找优化

    分区扫描,当表内的数据量很大同时具有很长的历史周期时,由于扫描数据缩减所带来的性能提升会有非常明显的效果,如图2所示。 图1 分区表示例图 图2 分区表剪枝示例图 父主题: 容量数据

    来自:帮助中心

    查看更多 →

  • 数据分区查找优化

    分区扫描,当表内的数据量很大同时具有很长的历史周期时,由于扫描数据缩减所带来的性能提升会有非常明显的效果,如图2所示。 图1 分区表示例图 图2 分区表剪枝示例图 父主题: 容量数据

    来自:帮助中心

    查看更多 →

  • 业务体验优化数据规划

    业务体验优化数据规划 VN间流量分配数据规划 Overlay ACL策略数据规划 QoS策略数据规划 智能选路数据规划 父主题: 数据规划

    来自:帮助中心

    查看更多 →

  • 大数据优化与提升服务

    数据优化与提升服务 结合华为自身理论经验,帮助企业规划构建大数据体系和治理平台。 产品介绍 常见问题 计费说明 父主题: 优化与提升

    来自:帮助中心

    查看更多 →

  • 数据库性能优化

    数据库性能优化 以下章节我们结合一些具体建议和案例来说明如何针对数据库的使用进行性能优化: 1.优化数据库配置实践 数据库的配置参数应从具体业务诉求着手,根据实际需要进行设计;华为云在各个数据库云服务中均提供了默认的配置参数,以满足最普遍的业务需要。 华为云提供了多款数据库服务,

    来自:帮助中心

    查看更多 →

  • 分区导入数据性能优化

    分区导入数据性能优化 场景描述 当往分区表中插入数据时候,如果插入的数据为常量/参数/表达式等简单类型,会自动对INSERT算子进行执行优化(FastPath)。可以通过执行计划来判断是否触发了执行优化,触发执行优化时Insert计划前会带有FastPath关键字。 示例 gaussdb=#

    来自:帮助中心

    查看更多 →

  • 优化数据库语句方法

    优化数据库语句方法 文档数据库属于NoSQL数据库,提供了可扩展的高性能数据解决方案,与关系型数据库(例如MySQL、SQLServer、Oracle)一样,在数据库设计、语句优化、索引创建等方面都会影响数据库的使用性能。 下面从不同维度,给出提升DDS使用性能的建议。 数据库和集合的创建

    来自:帮助中心

    查看更多 →

  • 分区导入数据性能优化

    分区导入数据性能优化 场景描述 当向分区表插入数据的时候,如果插入的数据为常量/参数/表达式等简单类型,会自动对INSERT算子进行执行优化(FastPath)。可以通过执行计划来判断是否触发了执行优化,触发执行优化时Insert计划前会带有FastPath关键字。 示例 gaussdb=#

    来自:帮助中心

    查看更多 →

  • 优化器

    优化器 查询重写 路径生成 计划生成 Analyze utile接口

    来自:帮助中心

    查看更多 →

  • 容量优化

    容量优化 在客户的运维工作中,为了保证业务可以持续运转不间断,需要提前识别高负载风险实例并提前做出应对措施。容量优化可以根据用户输入的安全阈值帮助客户快速识别风险实例并给出优化建议。 使用场景 当用户期望能预测资源的负载情况,识别出高负载资源时,可以使用该功能进行辅助预测。 限制与约束

    来自:帮助中心

    查看更多 →

  • 成本优化

    成本优化 在您通过成本中心了解和分析您的成本情况后,您可以确定成本偏高的原因,然后采取针对性的优化措施。 资源优化 您可以通过 云监控服务 监控资源的使用情况,识别空闲资源,寻找节约成本的机会。也可以根据成本分析阶段的分析结果识别成本偏高的资源,然后采取针对性的优化措施。 通过CES

    来自:帮助中心

    查看更多 →

  • 成本优化

    成本优化 在您通过成本中心了解和分析您的成本情况后,您可以确定成本偏高的原因,然后采取针对性的优化措施。 资源优化 通过CES查看GeminiDB Mongo监控指标,例如CPU、内存、磁盘的使用率,如果当前配置过高,可以通过规格变更降低配置。 监控GeminiDB Mongo资源闲置情况,及时删除闲置的实例。

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了