数据仓库服务 GaussDB(DWS)

 

GaussDB(DWS)是一款具备分析及混合负载能力的分布式数据库,支持x86和Kunpeng硬件架构,支持行存储与列存储,提供GB~PB级数据分析能力、多模分析和实时处理能力,用于数据仓库、数据集市、实时分析、实时决策和混合负载等场景,广泛应用于汽车、制造、零售、物流、互联网、金融、政府、电信等行业分析决策系统

 
 

    数据仓库里表设计规范 更多内容
  • 表设计规范

    设计规范 必须指定分布(DISTRIBUTE BY),分布策略选择的原则如下: 目前提供REPLICATION和HASH两种分布策略。REPLICATION分布会在每个节点保留一份相同的完整的数据。HASH分布会根据所提供的分布键值将数据分布到多个节点中。 对于系统配

    来自:帮助中心

    查看更多 →

  • 库表设计规范

    避免使用分区,如有需要,可以使用多个独立的代替。 分区的缺点: DDL操作需要锁定所有分区,导致所有分区上操作都被阻塞。 当数据量较大时,对分区进行DDL或其他运维操作难度大风险高。 分区使用较少,存在未知风险。 当单台 服务器 性能无法满足时,对分区进行分拆的成本较高。

    来自:帮助中心

    查看更多 →

  • Hudi表分区设计规范

    议使用。 建议 事实采用日期分区,维度采用非分区或者大颗粒度的日期分区 是否采用分区要根据的总数据量、增量和使用方式来决定。从的使用属性看事实和维度具有的特点: 事实:数据总量大,增量大,数据读取多以日期做切分,读取一定时间段的数据。 维度:总量相对小,增量小

    来自:帮助中心

    查看更多 →

  • Hudi表模型设计规范

    流式计算采用MOR。 流式计算为低时延的实时计算,需要高性能的流式读写能力,在Hudi中存在的MOR和COW两种模型中,MOR的流式读写性能相对较好,因此在流式计算场景下采用MOR模型。关于MOR在读写性能的对比关系如下: 对比维度 MOR COW 流式写 高 低 流式读

    来自:帮助中心

    查看更多 →

  • 设计规范

    设计规范 命名规范 数据库对象(库名、名、字段名、索引名)命名建议全部使用小写字母开头,后面跟字母或者数字,数据库对象(库名、名、字段名、索引名)名字长度建议都不要大于32字节。 数据库名称不能使用特殊字符("",.,$,\,/,*,?,~,#,:,|")和空字符\0,数据库

    来自:帮助中心

    查看更多 →

  • Hudi表索引设计规范

    Hudi索引设计规范 规则 禁止修改索引类型。 Hudi的索引会决定数据存储方式,随意修改索引类型会导致中已有的存量数据与新增数据之间出现数据重复和数据准确性问题。常见的索引类型如下: 布隆索引:Spark引擎独有索引,采用bloomfiter机制,将布隆索引内容写入到Parquet文件的footer中。

    来自:帮助中心

    查看更多 →

  • 设计规范

    设计规范 命名规范 数据库对象(库名、名、字段名、索引名)命名建议全部使用小写字母开头,后面跟字母或者数字,数据库对象(库名、名、字段名、索引名)名字长度建议都不要大于32字节。 数据库名称不能使用特殊字符("",.,$,\,/,*,?,~,#,:,|")和空字符\0,数据库

    来自:帮助中心

    查看更多 →

  • 基本设计规范

    规则4:设计分区键以均匀分发工作负载,避免出现数据倾斜问题。 的主键的分区键部分确定存储数据的逻辑分区,如果分区键分布不均衡,会导致节点与节点之间数据和负载不均衡,从而出现数据倾斜的问题。 如1为一些常见分区键分布均匀性的效果对比。 1 常见分区键分布均匀效果 分区键值 分区键分布均匀性

    来自:帮助中心

    查看更多 →

  • Hudi数据表设计规范

    Hudi数据设计规范 Hudi模型设计规范 Hudi索引设计规范 Hudi分区设计规范 父主题: Hudi应用开发规范

    来自:帮助中心

    查看更多 →

  • 索引设计规范

    索引列为的一列或多列计算而来的一个函数或者标量达式 限制使用 对于HASH分布,主键和唯一索引必须包含分布键。 当设计组合索引时,优化器会通过计算代价来选择合适的执行计划。例如:在组合索引(a,b,c)下,当查询时如果只使用过滤条件b,优化器经过计算索引成本较低时,会选择索引。

    来自:帮助中心

    查看更多 →

  • 权限设计规范

    允许使用指定的函数,以及利用这些函数实现的操作符。 空间 TABLESPACE CREATE 允许在空间中创建,允许在创建数据库和模式的时候把该空间指定为缺省空间。 TABLE INSERT,DELETE UPDATE,SELECT 允许用户对指定进行增删改查操作。 TRUNCATE

    来自:帮助中心

    查看更多 →

  • 索引设计规范

    index:示使用索引,如果只有 Using index,说明没有查询到数据,只用索引即完成了这个查询,这种情况为覆盖索引。如果同时出现Using where,代使用索引来查找读取记录, 也是可以用到索引的,但是需要查询到数据。 Using where:示条件查询,如

    来自:帮助中心

    查看更多 →

  • 数据仓库

    数据仓库 华为云数据仓库高级工程师培训 父主题: 培训服务

    来自:帮助中心

    查看更多 →

  • 数据仓库

    数据仓库 1 数据仓库权限 权限 对应API接口 授权项(Action) IAM项目 (Project) 企业项目 (Enterprise Project) 获取数据仓库 GET /v1.0/{project_id}/common/warehouses octopus:dataWarehouse:list

    来自:帮助中心

    查看更多 →

  • 数据仓库

    数据仓库 获取数据仓库信息 获取数据仓库的数据列 父主题: API

    来自:帮助中心

    查看更多 →

  • 获取数据仓库列表信息

    获取数据仓库信息 功能介绍 获取数据仓库 URI GET /v1.0/{project_id}/common/warehouses 1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目id,获取方法请参见获取项目ID 2 Query参数

    来自:帮助中心

    查看更多 →

  • Spark DAG设计规范说明

    车牌号1,[(通过时间,收费站3),(通过时间,收费站2),(通过时间,收费站4),(通过时间,收费站5)] 根据同行车要通过的收费站数量(例子为3)分段该车通过的收费站序列,如上面的数据被分解成 : 收费站3->收费站2->收费站4, (车牌号1,[收费站3时间,收费站2时间,收费站4时间])

    来自:帮助中心

    查看更多 →

  • 数据库设计规范

    数据库目前不支持不区分大小写的排序方式。 目前仅支持对数据库定义字符集,不支持对、字段等其他对象定义字符集。 业务使用前必须先创建业务数据库。 不应使用数据库安装后默认创建的postgres数据库存储业务数据。 创建数据库时必须指定字符集为UTF8,创建数据库时必须选择与客户端统一的编码字符集。 为了使用

    来自:帮助中心

    查看更多 →

  • 字段设计规范

    NULL字段,优化器在某些场景下会进行特殊优化,可较大提升查询性能。 不建议对预留字段。大部分场景下可支持快速新增、删除字段,或者修改字段的DEFAULT值。 新增列必须符合以下要求,否则会带来全更新开销,影响在线业务。 数据类型为以下类型中的一种:BOOL, BYTEA,

    来自:帮助中心

    查看更多 →

  • 阅读指引

    ,引导您完成创建数据仓库集群、创建数据库、上传数据和测试查询这一过程。 如果打算或正在将应用程序从其他数据仓库 GaussDB (DWS)迁移,您可能想知道GaussDB(DWS)在实施方式上有什么区别。 GaussDB(DWS)进行数据库应用程序开发过程中,下将帮您找到对应的信息。

    来自:帮助中心

    查看更多 →

  • 阅读指引

    ,引导您完成创建数据仓库集群、创建数据库、上传数据和测试查询这一过程。 如果计划或正在将应用程序从其他数据仓库向GaussDB(DWS)迁移,您可能想了解GaussDB(DWS)在实施方式上有什么区别。 GaussDB(DWS)进行数据库应用程序开发过程中,下将帮您找到对应的信息。

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了