中软国际数据治理专业服务解决方案实践

中软国际数据治理专业服务解决方案实践

    半结构化数据工作原理 更多内容
  • 设置云端结构化模板

    设置云端结构化模板 云日志服务(LTS)目前支持的结构化模板有两种,分别为系统模板和自定义模板。 系统模板 支持多种系统模板,不支持修改系统模板的字段类型和删除字段,详情请参考表1。 在云端结构化解析页面中,日志结构化方式选择“结构化模板”。 在“选择模板”下,选择“系统模板”,

    来自:帮助中心

    查看更多 →

  • 查询结构化日志(新版)

    查询结构化日志(新版) 功能介绍 该接口用于查询指定日志流下的结构化日志内容(新版)。 新版查询功能支持的局点信息请参考用户指南-日志可视化里的可视化章节。数据聚合结果不超过100亿条。仅支持分析最近30天内的数据,30天以上的数据不支持SQL分析。如您有更大的使用需求,请提工单申请。

    来自:帮助中心

    查看更多 →

  • Kudu

    t算法,该算法可确保只要副本总数的一以上可用,tablet就可以进行读写操作。例如,如果3个副本中有2个副本或5个副本中有3个副本可用,则tablet可用。即使主tablet出现故障,也可以通过只读的副tablet提供读取服务 支持结构化数据模型 通过结合所有以上属性,Kudu

    来自:帮助中心

    查看更多 →

  • Kudu应用开发简介

    算法,该算法可确保只要副本总数的一以上可用,tablet就可以进行读写操作。例如,如果3个副本中有2个副本或5个副本中有3个副本可用,则tablet可用。即使主tablet出现故障,也可以通过只读的副tablet提供读取服务。 支持结构化数据模型。 通过结合所有以上属性,Kud

    来自:帮助中心

    查看更多 →

  • Hive应用开发简介

    Hive是一个开源的,建立在Hadoop上的数据仓库框架,提供类似SQL的HQL语言操作结构化数据,其基本原理是将HQL语言自动转换成MapReduce任务或Spark任务,从而完成对Hadoop集群中存储的海量数据进行查询和分析。 Hive主要特点如下: 通过HQL语言非常容易的完成数据提取、转换和加载(ETL)。

    来自:帮助中心

    查看更多 →

  • 自动建表原理介绍

    自动建表原理介绍 CDM 将根据源端的字段类型进行默认规则转换成目的端字段类型,并在目的端建数据表。 自动建表时的字段类型映射 CDM在数据仓库服务(Data Warehouse Service,简称DWS)中自动建表时,DWS的表与源表的字段类型映射关系如图1所示。例如使用CDM

    来自:帮助中心

    查看更多 →

  • HBase基本原理

    HBase基本原理 数据存储使用HBase来承接,HBase是一个开源的、面向列(Column-Oriented)、适合存储海量非结构化数据结构化数据的、具备高可靠性、高性能、可灵活扩展伸缩的、支持实时数据读写的分布式存储系统。更多关于HBase的信息,请参见:https://hbase

    来自:帮助中心

    查看更多 →

  • Hive基本原理

    参考Hive应用开发。 元数据存储:Hive将元数据存储在数据库中,如MySQL、Derby。Hive中的元数据包括表的名字,表的列和分区及其属性,表的属性(是否为外部表等),表的数据所在目录等。 Hive结构 Hive为单实例的服务进程,提供服务的原理是将HQL编译解析成相应的

    来自:帮助中心

    查看更多 →

  • Kafka基本原理

    Kafka基本原理 Kafka是一个分布式的、分区的、多副本的消息发布-订阅系统,它提供了类似于JMS的特性,但在设计上完全不同,它具有消息持久化、高吞吐、分布式、多客户端支持、实时等特性,适用于离线和在线的消息消费,如常规的消息收集、网站活性跟踪、聚合统计系统运营数据(监控数据)、日志

    来自:帮助中心

    查看更多 →

  • HetuEngine基本原理

    op集群( MRS )的Hive、Hudi数据的交互式快速查询场景。 HetuEngine跨源功能简介 出于管理和信息收集的需要,企业内部会存储海量数据,包括数目众多的各种数据库、数据仓库等,此时会面临数据源种类繁多、数据结构化混合、相关数据存放分散等困境,导致跨源查询开发成本高,跨源复杂查询耗时长。

    来自:帮助中心

    查看更多 →

  • 产品架构和功能原理

    检查和校验后,执行导入命令将数据恢复到目标数据库。 实时同步基本原理 图4 实时同步原理 实时同步功能实现源数据库和目标数据库的数据长期同步,主要用于OLTP到OLAP、OLTP到大数据组件的数据实时同步。全量和增量的数据同步和实时迁移的技术原理基本一致,但是基于不同的业务使用场景,两个功能还是有些差异。

    来自:帮助中心

    查看更多 →

  • 异地双活原理介绍

    Cassandra数据库可以同时为用户业务提供服务。当一个数据中心发生故障而另一个数据中心正常运行时,可以通过业务层的调度将故障区域的业务切换到正常区域,因为配置了异地双活,您可以在数据中心运行正常的区域继续处理数据。在业务不中断的前提下实现故障场景下业务的快速恢复,保证了故障场景下业务的连续性。

    来自:帮助中心

    查看更多 →

  • GaussDB(for MySQL)备份原理

    GaussDB (for MySQL)备份原理数据库 GaussDB(for MySQL)基于华为最新一代DFV存储,采用计算与存储分离架构,计算层用于给外部提供服务,管理日志信息,存储层存储数据信息。存储层分为Common Log节点和Slice Store节点,Common

    来自:帮助中心

    查看更多 →

  • HDFS基本原理

    NameNode中的数据保持同步,处理来自客户端的读请求。 DataNode 用于存储每个文件的“数据块”数据,并且会周期性地向NameNode报告该DataNode的数据存放情况。 JournalNode HA集群下,用于同步主备NameNode之间的元数据信息。 ZKFC Z

    来自:帮助中心

    查看更多 →

  • MemArtsCC基本原理

    MemArtsCC基本原理 MemArtsCC是一个分布式计算侧缓存系统。计算任务运行在计算集群的虚拟机(Virtual Machine, VM)上,数据存储在远端的对象存储(Object Storage Service, OBS)集群中。由于远端OBS的数据访问速度限制,VM上的

    来自:帮助中心

    查看更多 →

  • Doris基本原理

    需要用索引过滤大量数据的查询中。 在开启了写时合并选项的Unique表中,数据在导入阶段就会去将被覆盖和被更新的数据进行标记删除,同时将新的数据写入新的文件。在查询时,所有被标记删除的数据都会在文件级别被过滤,读取出的数据就都是最新的数据,消除了读时合并中的数据聚合过程,并且能够

    来自:帮助中心

    查看更多 →

  • Kudu应用开发简介

    算法,该算法可确保只要副本总数的一以上可用,tablet就可以进行读写操作。例如,如果3个副本中有2个副本或5个副本中有3个副本可用,则tablet可用。即使主tablet出现故障,也可以通过只读的副tablet提供读取服务。 支持结构化数据模型。 通过结合所有以上属性,Kud

    来自:帮助中心

    查看更多 →

  • 创建结构化配置(推荐)

    创建结构化配置(推荐) 功能介绍 该接口通过结构化模板创建结构化配置,便于参数提取且简化参数结构,推荐您使用。 单个用户每秒仅能调用1次该接口。 调用方法 请参见如何调用API。 URI POST /v3/{project_id}/lts/struct/template 表1 路径参数

    来自:帮助中心

    查看更多 →

  • 只读落后自愈技术原理

    只读落后自愈技术原理 TaurusDB是存储计算分离架构的云原生数据库,只读节点和主节点共享底层的存储数据。为了保证内存中的缓存数据的一致性,主节点与只读节点通信后,只读节点需要从Log Stores中读取主节点产生的redo来更新内存中的缓存数据。 图1 只读落后自愈技术原理图 主节点与只读节点的通信

    来自:帮助中心

    查看更多 →

  • Spark基本原理

    Streaming失败,这些接收到的数据也不会丢失。另外,接收数据的正确性只在数据被预写到日志以后Receiver才会确认,已经缓存但还没有保存的数据可以在Driver重新启动之后由数据源再发送一次。这两个机制确保了零数据丢失,即所有的数据或者从日志中恢复,或者由数据源重发。 如果需要启用预写日志功能,可以通过如下动作实现:

    来自:帮助中心

    查看更多 →

  • Hue基本原理

    Hue基本原理 Hue是一组WEB应用,用于和MRS大数据组件进行交互,能够帮助用户浏览HDFS,进行Hive查询,启动MapReduce任务等,它承载了与所有MRS大数据组件交互的应用。 Hue主要包括了文件浏览器和查询编辑器的功能: 文件浏览器能够允许用户直接通过界面浏览以及操作HDFS的不同目录;

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了