MapReduce服务 MRS

 

MapReduce服务(MapReduce Service)提供租户完全可控的企业级大数据集群云服务,轻松运行Hadoop、Spark、HBase、Kafka、Storm等大数据组件。包年更优惠,买1年只需付10个月费用

 
 

    mapreduce2 工作原理 更多内容
  • 备份原理及方案

    备份原理及方案 RDS实例支持自动备份和手动备份,您可以定期对数据库进行备份,当数据库故障或数据损坏时,可以通过备份文件恢复数据库,从而保证数据可靠性。 云数据库RDS通过Sysbench导入数据模型和一定量的数据,备份后压缩比约为80%。其中,重复数据越多,压缩比越高。 压缩比

    来自:帮助中心

    查看更多 →

  • 增量迁移原理介绍

    增量迁移原理介绍 文件增量迁移 关系数据库增量迁移 HBase/CloudTable增量迁移 MongoDB/DDS增量迁移 父主题: 进阶实践

    来自:帮助中心

    查看更多 →

  • Hive CBO原理介绍

    Hive CBO原理介绍 Hive CBO原理介绍 CBO,全称是Cost Based Optimization,即基于代价的优化器。 其优化目标是: 在编译阶段,根据查询语句中涉及到的表和查询条件,计算出产生中间结果少的高效join顺序,从而减少查询时间和资源消耗。 Hive中实现CBO的总体过程如下:

    来自:帮助中心

    查看更多 →

  • 背景和原理(对象)

    背景和原理(对象) AstroZero提供的数据对象(Object)定义功能,对应传统方式开发业务系统中的创建数据库表。每个Object对应一张数据库表,用于保存业务系统需要的配置数据和业务数据。 对象用于存储组织或者业务特有的数据,可理解为数据库中的数据表(逻辑表,系统实际存储

    来自:帮助中心

    查看更多 →

  • 迁移作业原理

    迁移作业原理 数据迁移模型 CDM 数据迁移时,简化的迁移模型如图1所示。 图1 CDM数据迁移模型 CDM通过数据迁移作业,将源端数据迁移到目的端数据源中。其中,主要运行逻辑如下: 数据迁移作业提交运行后,CDM会根据作业配置中的“抽取并发数”参数,将每个作业拆分为多个Task,即作业分片。

    来自:帮助中心

    查看更多 →

  • 备份原理及方案

    备份原理及方案 RDS实例支持自动备份和手动备份,您可以定期对数据库进行备份,当数据库故障或数据损坏时,可以通过备份文件恢复数据库,从而保证数据可靠性。 云数据库RDS通过Sysbench导入数据模型和一定量的数据,备份后压缩比约为80%。其中,重复数据越多,压缩比越高。 压缩比

    来自:帮助中心

    查看更多 →

  • 备份原理及方案

    备份原理及方案 DDS实例支持自动备份和手动备份,您可以定期对数据库进行备份,当数据库故障或数据损坏时,可以通过备份文件恢复数据库,从而保证数据可靠性。 备份原理 集群实例 集群实例由dds mongos(路由)、Config(配置)和Shard(分片)组件构成。其中,Confi

    来自:帮助中心

    查看更多 →

  • 节点伸缩原理

    。 前提条件 使用节点伸缩功能前,需要安装CCE集群弹性引擎插件,插件版本要求1.13.8及以上。 Cluster Autoscaler工作原理 Cluster Autoscaler主要流程包括两部分: 扩容流程: Autoscaler会每隔10s检查一次所有未调度的Pod,根据

    来自:帮助中心

    查看更多 →

  • 背景与原理(BPM)

    背景与原理(BPM) 工单管理模块中的工单场景业务编排是通过AstroZero的流程编排BPM(Business Process Management)功能实现的,通过在前端页面调用BPM完成工单流转,即客服人员创单,派单员派发工单,维修工程师处理工单的全过程。 开发BPM即是对

    来自:帮助中心

    查看更多 →

  • 增量迁移原理介绍

    增量迁移原理介绍 文件增量迁移 关系数据库增量迁移 HBase/CloudTable增量迁移 MongoDB/DDS增量迁移 父主题: 数据迁移进阶实践

    来自:帮助中心

    查看更多 →

  • 增量迁移原理介绍

    增量迁移原理介绍 文件增量迁移 关系数据库增量迁移 HBase/CloudTable增量迁移 MongoDB/DDS增量迁移 父主题: 关键操作指导

    来自:帮助中心

    查看更多 →

  • 增量迁移原理介绍

    增量迁移原理介绍 文件增量迁移 关系数据库增量迁移 HBase/CloudTable增量迁移 父主题: 关键操作指导

    来自:帮助中心

    查看更多 →

  • 只读落后自愈技术原理

    只读落后自愈技术原理 GaussDB (for MySQL)是存储计算分离架构的云原生数据库,只读节点和主节点共享底层的存储数据。为了保证内存中的缓存数据的一致性,主节点与只读节点通信后,只读节点需要从Log Stores中读取主节点产生的redo来更新内存中的缓存数据。 图1 只读落后自愈技术原理图

    来自:帮助中心

    查看更多 →

  • Spark基本原理

    Task集合,由DAG分割而成。 Task 承载业务逻辑的运算单元,是Spark平台上可执行的最小工作单元。一个应用根据执行计划以及计算量分为多个Task。 Spark应用运行原理 Spark的应用运行架构如图 Spark应用运行架构所示,运行流程如下所示: 应用程序(Appli

    来自:帮助中心

    查看更多 →

  • Hue基本原理

    Hue基本原理 Hue是一组WEB应用,用于和 MRS 大数据组件进行交互,能够帮助用户浏览HDFS,进行Hive查询,启动MapReduce任务等,它承载了与所有MRS大数据组件交互的应用。 Hue主要包括了文件浏览器和查询编辑器的功能: 文件浏览器能够允许用户直接通过界面浏览以及操作HDFS的不同目录;

    来自:帮助中心

    查看更多 →

  • Storm基本原理

    Storm基本原理 Apache Storm是一个分布式、可靠、容错的实时流式数据处理的系统。在Storm中,先要设计一个用于实时计算的图状结构,称之为拓扑(topology)。这个拓扑将会被提交给集群,由集群中的主控节点(master node)分发代码,将任务分配给工作节点(worker

    来自:帮助中心

    查看更多 →

  • Flink基本原理

    Flink基本原理 Flink简介 Flink是一个批处理和流处理结合的统一计算框架,其核心是一个提供了数据分发以及并行化计算的流数据处理引擎。它的最大亮点是流处理,是业界最顶级的开源流处理引擎。 Flink最适合的应用场景是低时延的数据处理(Data Processing)场景

    来自:帮助中心

    查看更多 →

  • YARN基本原理

    周期内的所有工作。包括: 与RM调度器协商以获取资源。 将得到的资源进一步分配给内部的任务(资源的二次分配)。 与NM通信以启动/停止任务。 监控所有任务运行状态,并在任务运行失败时重新为任务申请资源以重启任务。 开源容量调度器Capacity Scheduler原理 Capacity

    来自:帮助中心

    查看更多 →

  • 背景及原理(服务编排)

    背景及原理(服务编排) AstroZero的服务编排,支持对逻辑判断组件、数据处理组件,以及脚本、子服务编排、商业对象等进行可视化组合编排,实现丰富的业务功能。 了解服务编排 在传统的开发中程序员一般是基于代码进行开发,程序员需要学习内容较多,开发效率相对低一些,开发门槛也高。A

    来自:帮助中心

    查看更多 →

  • 自动建表原理介绍

    自动建表原理介绍 CDM将根据源端的字段类型进行默认规则转换成目的端字段类型,并在目的端建数据表。 自动建表时的字段类型映射 CDM在 数据仓库 服务(Data Warehouse Service,简称DWS)中自动建表时,DWS的表与源表的字段类型映射关系如图1所示。例如使用CDM

    来自:帮助中心

    查看更多 →

  • 产品架构和功能原理

    行导入命令将数据恢复到目标数据库。 实时同步基本原理 图4 实时同步原理 实时同步功能实现源数据库和目标数据库的数据长期同步,主要用于OLTP到OLAP、OLTP到大数据组件的数据实时同步。全量和增量的数据同步和实时迁移的技术原理基本一致,但是基于不同的业务使用场景,两个功能还是有些差异。

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了