中软国际数据治理专业服务解决方案实践

中软国际数据治理专业服务解决方案实践

    半结构化数据工作原理 更多内容
  • HSS的数据传输实现原理是什么?

    HSS的数据传输实现原理是什么? 端口使用:HSS采用企业主机安全服务端的443端口,Agent使用的是随机端口通信,Agent可以通过任意端口将数据传输到HSS的443端口。 传输方式:HSS是通过IP的方式进行传输,监控的Agent是通过DNS的方式传输,传输过程不会产生数据丢失的情况。

    来自:帮助中心

    查看更多 →

  • Kudu应用开发简介

    算法,该算法可确保只要副本总数的一以上可用,tablet就可以进行读写操作。例如,如果3个副本中有2个副本或5个副本中有3个副本可用,则tablet可用。即使主tablet出现故障,也可以通过只读的副tablet提供读取服务。 支持结构化数据模型。 通过结合所有以上属性,Kud

    来自:帮助中心

    查看更多 →

  • Kudu应用开发简介

    算法,该算法可确保只要副本总数的一以上可用,tablet就可以进行读写操作。例如,如果3个副本中有2个副本或5个副本中有3个副本可用,则tablet可用。即使主tablet出现故障,也可以通过只读的副tablet提供读取服务。 支持结构化数据模型。 通过结合所有以上属性,Kud

    来自:帮助中心

    查看更多 →

  • Spark基本原理

    Streaming失败,这些接收到的数据也不会丢失。另外,接收数据的正确性只在数据被预写到日志以后Receiver才会确认,已经缓存但还没有保存的数据可以在Driver重新启动之后由数据源再发送一次。这两个机制确保了零数据丢失,即所有的数据或者从日志中恢复,或者由数据源重发。 如果需要启用预写日志功能,可以通过如下动作实现:

    来自:帮助中心

    查看更多 →

  • Hue基本原理

    Hue基本原理 Hue是一组WEB应用,用于和 MRS 数据组件进行交互,能够帮助用户浏览HDFS,进行Hive查询,启动MapReduce任务等,它承载了与所有MRS大数据组件交互的应用。 Hue主要包括了文件浏览器和查询编辑器的功能: 文件浏览器能够允许用户直接通过界面浏览以及操作HDFS的不同目录;

    来自:帮助中心

    查看更多 →

  • Storm基本原理

    Spout Topology中产生源数据的组件,是Tuple的来源,通常可以从外部数据源(如消息队列、数据库、文件系统、TCP连接等)读取数据,然后转换为Topology内部的数据结构Tuple,由下一级组件处理。 Bolt Topology中接受数据并执行具体处理逻辑(如过滤,统计、转换、合并、结果持久化等)的组件。

    来自:帮助中心

    查看更多 →

  • Flink基本原理

    Flink基本原理 Flink简介 Flink是一个批处理和流处理结合的统一计算框架,其核心是一个提供了数据分发以及并行化计算的流数据处理引擎。它的最大亮点是流处理,是业界最顶级的开源流处理引擎。 Flink最适合的应用场景是低时延的数据处理(Data Processing)场景

    来自:帮助中心

    查看更多 →

  • YARN基本原理

    周期内的所有工作。包括: 与RM调度器协商以获取资源。 将得到的资源进一步分配给内部的任务(资源的二次分配)。 与NM通信以启动/停止任务。 监控所有任务运行状态,并在任务运行失败时重新为任务申请资源以重启任务。 开源容量调度器Capacity Scheduler原理 Capacity

    来自:帮助中心

    查看更多 →

  • 背景及原理(服务编排)

    背景及原理(服务编排) AstroZero的服务编排,支持对逻辑判断组件、数据处理组件,以及脚本、子服务编排、商业对象等进行可视化组合编排,实现丰富的业务功能。 了解服务编排 在传统的开发中程序员一般是基于代码进行开发,程序员需要学习内容较多,开发效率相对低一些,开发门槛也高。A

    来自:帮助中心

    查看更多 →

  • 自动建表原理介绍

    针对DECIMAL类型,源端数据源长度超过Hive长度可能导致精度丢失。 Hive DECIMAL(P,S)类型1 ≤ precision ≤ 38,0 ≤ scale。源端p > 38位时,Hive按38位创建,s小于0时,按0创建,受Hive数据类型限制,此场景可能会导致数据写入后精度丢失。

    来自:帮助中心

    查看更多 →

  • Hive应用开发简介

    Hive是一个开源的,建立在Hadoop上的数据仓库框架,提供类似SQL的HQL语言操作结构化数据,其基本原理是将HQL语言自动转换成Mapreduce任务或Spark任务,从而完成对Hadoop集群中存储的海量数据进行查询和分析。 Hive主要特点如下: 通过HQL语言非常容易的完成数据提取、转换和加载(ETL)。

    来自:帮助中心

    查看更多 →

  • HBase基本原理

    HBase基本原理 数据存储使用HBase来承接,HBase是一个开源的、面向列(Column-Oriented)、适合存储海量非结构化数据结构化数据的、具备高可靠性、高性能、可灵活扩展伸缩的、支持实时数据读写的分布式存储系统。更多关于HBase的信息,请参见:https://hbase

    来自:帮助中心

    查看更多 →

  • Hive基本原理

    参考Hive应用开发。 元数据存储:Hive将元数据存储在数据库中,如MySQL、Derby。Hive中的元数据包括表的名字,表的列和分区及其属性,表的属性(是否为外部表等),表的数据所在目录等。 Hive结构 Hive为单实例的服务进程,提供服务的原理是将HQL编译解析成相应的

    来自:帮助中心

    查看更多 →

  • Kafka基本原理

    Kafka基本原理 Kafka是一个分布式的、分区的、多副本的消息发布-订阅系统,它提供了类似于JMS的特性,但在设计上完全不同,它具有消息持久化、高吞吐、分布式、多客户端支持、实时等特性,适用于离线和在线的消息消费,如常规的消息收集、网站活性跟踪、聚合统计系统运营数据(监控数据)、日志

    来自:帮助中心

    查看更多 →

  • HetuEngine基本原理

    op集群(MRS)的Hive、Hudi数据的交互式快速查询场景。 HetuEngine跨源功能简介 出于管理和信息收集的需要,企业内部会存储海量数据,包括数目众多的各种数据库、数据仓库等,此时会面临数据源种类繁多、数据结构化混合、相关数据存放分散等困境,导致跨源查询开发成本高,跨源复杂查询耗时长。

    来自:帮助中心

    查看更多 →

  • CarbonData基本原理

    简单的Table数据集定义:CarbonData支持易于使用的DDL(数据定义语言)语句来定义和创建数据集。CarbonData DDL十分灵活、易于使用,并且足够强大,可以定义复杂类型的Table。 便捷的数据管理:CarbonData为数据加载和维护提供多种数据管理功能。Car

    来自:帮助中心

    查看更多 →

  • CDL基本原理

    CDL基本原理 CDL简介 CDL(全称Change Data Loader)是一个基于Kafka Connect框架的实时数据集成服务。 CDL服务能够从各种OLTP数据库中捕获数据库的Data Change事件,并推送到kafka,再由sink connector推送到大数据生态系统中。

    来自:帮助中心

    查看更多 →

  • StarRocks基本原理

    Key Model)。 这四种数据模型能够支持多种数据分析场景,例如 日志分析 数据汇总分析、实时分析等。创建表时,您需要指定数据模型(Data Model),当数据导入至数据模型时,StarRocks会按照排序键对数据进行排序、处理和存储。四种数据模型介绍如下: 明细模型 明细模

    来自:帮助中心

    查看更多 →

  • 自动建表原理介绍

    针对DECIMAL类型,源端数据源长度超过Hive长度可能导致精度丢失。 Hive DECIMAL(P,S)类型1 ≤ precision ≤ 38,0 ≤ scale。源端p > 38位时,Hive按38位创建,s小于0时,按0创建,受Hive数据类型限制,此场景可能会导致数据写入后精度丢失。

    来自:帮助中心

    查看更多 →

  • CloudTable HBase输出流

    HBase支持消息数据、报表数据、推荐类数据、风控类数据、日志数据、订单数据结构化结构化的KeyValue数据存储。 利用 DLI ,用户可方便地将海量数据高速、低时延写入HBase。 表格存储服务 (CloudTable),是基于Apache HBase提供的分布式、可伸缩、全

    来自:帮助中心

    查看更多 →

  • 产品架构和功能原理

    检查和校验后,执行导入命令将数据恢复到目标数据库。 实时同步基本原理 图4 实时同步原理 实时同步功能实现源数据库和目标数据库的数据长期同步,主要用于OLTP到OLAP、OLTP到大数据组件的数据实时同步。全量和增量的数据同步和实时迁移的技术原理基本一致,但是基于不同的业务使用场景,两个功能还是有些差异。

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了