数据仓库服务 GaussDB(DWS)

 

GaussDB(DWS)是一款具备分析及混合负载能力的分布式数据库,支持x86和Kunpeng硬件架构,支持行存储与列存储,提供GB~PB级数据分析能力、多模分析和实时处理能力,用于数据仓库、数据集市、实时分析、实时决策和混合负载等场景,广泛应用于汽车、制造、零售、物流、互联网、金融、政府、电信等行业分析决策系统

 
 

    维度模型设计数据仓库 更多内容
  • 数据资产

    术资产呈现。同时支持采集规范设计创建的数据模型,作为业务资产呈现,并与技术资产自动关联。规范设计中创建的指标也会采集并作为指标资产呈现。 图1 数据地图 元数据采集 元数据(Metadata)是关于数据的数据。在 数据仓库 系统中,元数据可以帮助数据仓库管理员和开发人员非常方便地找到

    来自:帮助中心

    查看更多 →

  • 数据架构使用流程

    同遵守。 模型设计:应用逻辑模型、关系建模、维度建模和数据集市的方法,进行分层建模。 逻辑模型:用于创建逻辑模型以及逻辑模型的修改和删除,转化为物理模型。同时,可以对逻辑实体进行创建及发布,进行逆向数据库等操作。 关系建模:基于关系建模,新建SDI层和DWI层两个模型。 SDI:Source

    来自:帮助中心

    查看更多 →

  • 配置中心

    当多人或多个团队在同时使用这个功能时,要协调好功能配置项,否则会造成个别的操作失败。 模型配置 在模型设计过程中,设置维度维度表)、事实表、汇总表的默认表编码前缀,通过以下页面进行配置。 父主题: 规范设计

    来自:帮助中心

    查看更多 →

  • 参考:作业分片维度

    参考:作业分片维度 CDM 在进行作业分片时,根据源端数据源的差异,分片维度有所不同。详情如表1所示。 表1 不同源端数据源的作业分片维度 数据源分类 源端数据源 作业分片原理 数据仓库 数据仓库服务(DWS) 支持按表字段分片。 不支持按表分区分片。 数据湖探索 DLI ) 支持分区表的分区信息分片。

    来自:帮助中心

    查看更多 →

  • 主机指标及其维度

    物理磁盘已使用总容量和物理磁盘总容量指标仅统计本地磁盘分区的文件系统类型,不统计主机通过网络形式挂载的文件系统(juicefs、nfs、smb等)。 表2 主机指标维度 维度 说明 clusterId 集群ID。 clusterName 集群名称。 gpuName GPU名称。 gpuID GPU ID。 npuName

    来自:帮助中心

    查看更多 →

  • 网络指标及其维度

    总Bps(aom_node_network_total_bytes) 该指标用于统计测试对象出方向和入方向的网络流速之和。 ≥0 字节/秒(Byte/s) 表2 网络指标维度 维度 说明 clusterId 集群ID。 hostID 主机ID。 nameSpace 集群的命名空间。 netDevice 网卡名称。 nodeIP

    来自:帮助中心

    查看更多 →

  • 参考:作业分片维度

    参考:作业分片维度 CDM在进行作业分片时,根据源端数据源的差异,分片维度有所不同。详情如表1所示。 表1 不同源端数据源的作业分片维度 数据源分类 源端数据源 作业分片原理 数据仓库 数据仓库服务(DWS) 支持按表字段分片。 不支持按表分区分片。 数据湖 探索(DLI) 支持分区表的分区信息分片。

    来自:帮助中心

    查看更多 →

  • 查看维度表详情

    IBUTE: 汇总表维度属性 SUMMARY_INDEX: 汇总表指标属性 SUMMARY_TIME: 汇总表时间周期属性 TABLE_MODEL: 关系模型(逻辑模型/物理模型) TABLE_MODEL_ATTRIBUTE: 关系模型属性(逻辑模型/物理模型) TABLE_MODEL_ LOG IC:

    来自:帮助中心

    查看更多 →

  • 查看维度颗粒度

    IBUTE: 汇总表维度属性 SUMMARY_INDEX: 汇总表指标属性 SUMMARY_TIME: 汇总表时间周期属性 TABLE_MODEL: 关系模型(逻辑模型/物理模型) TABLE_MODEL_ATTRIBUTE: 关系模型属性(逻辑模型/物理模型) TABLE_MODEL_LOGIC:

    来自:帮助中心

    查看更多 →

  • 集群指标及其维度

    l_memory_usage) 该指标用于统计测量对象已使用虚拟内存占虚拟内存总量的百分比。 0~100 百分比(%) 表2 集群指标维度 维度 说明 clusterId 集群ID。 clusterName 集群名称。 projectId 项目ID。 父主题: 指标总览

    来自:帮助中心

    查看更多 →

  • 座席维度实时接口

    座席维度实时接口 批量查询座席签入的技能队列 批量查询座席信息 查询指定座席的当前呼叫ID 批量查询所有座席的呼叫信息 查询指定座席的私有呼叫 批量查询座席状态下的座席个数 查询指定座席详细信息 查询座席休息信息 查询座席是否有通话在处理 查询座席维度系统状态信息 获取座席实时监控指标

    来自:帮助中心

    查看更多 →

  • 数据仓库规格

    数据仓库规格 GaussDB (DWS)的规格按照产品类型分为标准数仓、实时数仓和IoT数仓。其中实时数仓还包含单机版模式。各产品类型的不同差异,详情请参见数据仓库类型。 标准数仓(DWS 2.0)规格 标准数仓(DWS 2.0)云盘规格,该规格弹性伸缩,无限算力、无限容量,规格详情请参见表1。

    来自:帮助中心

    查看更多 →

  • 数据仓库类型

    数据仓库类型 产品类型概述 标准数仓(DWS 2.0):面向数据分析场景,为用户提供高性能、高扩展、高可靠、高安全、易运维的企业级数仓服务,支持2048节点、20PB级超大规模数据分析能力。支持冷热数据分析,存储、计算弹性伸缩,并按需、按量计价,为用户提供弹性灵活、极致性价比的体

    来自:帮助中心

    查看更多 →

  • 查询单个主维度下子维度监控对象列表

    查询单个主维度下子维度监控对象列表 功能介绍 查询主维度下子维度监控对象列表,当前支持子维度的主维度ID的有 dcs_instance_id。 调用方法 请参见如何调用API。 URI GET /v2/{project_id}/dims/monitored-objects/{instance_id}

    来自:帮助中心

    查看更多 →

  • 关系建模和维度建模的区别?

    关系建模和维度建模的区别? 问题描述 关系建模和维度建模的区别是什么。 解决方案 关系建模为事务性模型,对应三范式建模。 维度建模为分析性模型,主要包括事实表、维度表的设计,多用于实现多角度、多层次的数据查询和分析。 DataArts Studio 是基于数据湖的数据运营平台,维度建模使用的场景比较多。

    来自:帮助中心

    查看更多 →

  • 数据仓库服务 GaussDB(DWS)

    热门案例 数据库、数据仓库、数据湖、湖仓一体分别是什么? 无法成功创建数据仓库集群时怎么处理? 数据仓库和Hadoop大数据平台有什么差别? 无法连接数据仓库集群时怎么处理? 可以通过SSH访问DWS集群的节点吗? 如何选择公有云DWS或者公有云RDS? 数据在数据仓库服务中是否安全?

    来自:帮助中心

    查看更多 →

  • 数据架构操作列表

    资源名称 事件名称 查看主题设计 DAYU_DS dsSubject getListSubject 创建主题设计 DAYU_DS dsSubject createSubject 更新主题设计 DAYU_DS dsSubject updateSubject 发布主题设计 DAYU_DS dsSubject

    来自:帮助中心

    查看更多 →

  • 数据库、数据仓库、数据湖与华为智能数据湖方案是什么,有哪些区别和联系?

    的运营模型,也能为企业提供其他能力,如预测分析、推荐模型等,这些模型能刺激企业能力的后续增长。 对于数据仓库与数据湖的不同之处,可以类比为仓库和湖泊的区别:仓库存储着来自特定来源的货物;而湖泊的水来自河流、溪流和其他来源,并且是原始数据。 表2 数据湖与数据仓库的对比 维度 数据湖

    来自:帮助中心

    查看更多 →

  • 流程设计

    流程设计 宏观层面:重点是组织架构与流程架构匹配,组织设置必须支撑流程价值实现,组织职责必须清晰具体,不能有重叠、空白、过多、过少; 微观层面:看流程角色职责是否通过岗位职责的设置有效落实,岗位职责与其匹配的流程角色职责相符。 单击左侧导航栏“流程设计”并进入流程设计页面。 图1

    来自:帮助中心

    查看更多 →

  • 表设计

    设计 GaussDB是分布式架构。数据分布在各个DN上。总体上讲,良好的表设计需要遵循以下原则: 【关注】将表数据均匀分布在各个DN上。数据均匀分布,可以防止数据在部分DN上集中分布,从而导致因存储倾斜造成集群有效容量下降。通过选择合适的分布列,可以避免数据倾斜。 【关注】将表

    来自:帮助中心

    查看更多 →

  • 表设计

    设计 总体上讲,良好的表设计需要遵循以下原则: 减少需要扫描的数据量。通过分区表的剪枝机制可以大幅减少数据的扫描量。 尽量减少随机I/O。通过聚簇可以实现热数据的连续存储,将随机I/O转换为连续I/O,从而减少扫描的I/O代价。 选择分区方案 当表中的数据量很大时,应当对表进行分区,一般需要遵循以下原则:

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了