文档首页 > > 数据资产管理服务> 用户指南> 附录 元数据管理与数据处理(旧版本)> 专题:多维建模> 基本概念

基本概念

分享
更新时间:2020/11/23 GMT+08:00
表1 维度相关概念

类型

描述

维度

人们观察数据的特定角度,是考虑问题时的一类属性,属性集合构成一个维(例如:时间维、地区维等)。维度与数据的有效性和表达业务成效的关键性能指标相互依赖。

层次

在数据治理中,维度管理可以根据维表的表结构特点来定义层次。层次分传统层次和递归层次。

  • 传统层次

由一个或以上的级别组成,用来表示数据结构的层级关系。

例如:一个包含“年”、“月”、“日”三个级别的时间维度,可以将级别“年”、“月”作为一个层次“年月”,可以将级别“月”、“日”作为一个层次“月日”。

  • 递归层次

又称父子层次。在具有树形结构特征的表结构(如:雇佣关系表、地理区域关系表)中,各维度成员的子成员都记录了父成员的ID,父子层次即由维度成员间父子关系组成的层次结构。

例如:在一个公司或行政机构中,雇佣关系数据表中,常存在雇员姓名(employee),雇员ID(employee_id),主管ID(supervisor_id)等字段,您可以指定supervisor_id为父列,指定supervisor_id列中某一主管ID为父节点ID,就可以构造以该主管为父节点,以下级别的雇员为子节点的层次结构。

级别

维度的最小单元,通常一个级别可以成为一个分析的粒度。

例如:在时间维度中,可以将“年-季度-月”划分为一个层次,其中“年”、“季度”和“月”成为这个层次的3个级别。同理,当建立产品维度时,可以将“产品大类-产品子类-产品”划为一个层次,其中“产品大类”、“产品子类”和“产品”成为这个层次的3个级别。

表2 维度分类

类型

描述

普通维度

参见表1中的维度定义。

雪花维度

在维度表的层次中,低粒度属性作为辅助表通过属性键连接到基本维度表。当这一过程包含多重维度表层次时,建立的多级层次结构被称为雪花模式。

退化维度

一般来说事实表中的外键都对应一个维表,维的信息主要存放在维表中;但是退化维仅仅是事实表中的一列,这个维的相关信息都在这一列中,没有维表与之相关联。比如:发票号,序列号等。

内嵌维度

在单个事实表内定义的维度,不与其他事实表共用。

说明:
  • 退化维度和内嵌维度依赖事实表,在事实表中才存在意义,故这两种类型维度在事实表中进行增删改查。
  • 退化维度和内嵌维度时和事实表强相关,不可以多个事实表共用。
表3 度量分类

类型

描述

简单度量

度量是一个特殊的维。量度的成员类型是数值型的,用于描述维成员的量属性。

例如,利润、销售成本等都可以看作是量度。

计算度量

将定义的量度加以计算形成的量度。

例如:如果将销售额作为量度,则可以将平均销售额(总销售额除以门店数)作为计算量度。

表4 事实表分类

表类型

描述

普通事实表

不带维度配置的事实表。

基础事实表

带维度配置的事实表。

汇聚事实表

多个事实表汇聚而形成的事实表。

profile事实表

profile模型是对明细表中多个字段属性进行分类形成的明细模型。供用户查看详情,及为多维分析结果提供支撑依据。

例如:在进行GPRS流量数据分析时,您可以通过配置相应的Cube,从地区、产品等维度上查看某一时间内的GPRS统计流量,分析出GPRS统计流量最多的产品,然后通过配置相应的明细,查看GPRS流量统计量最多的产品的消费人群,分析GPRS流量消费大的客户的消费特征,从而制定出适当的营销策略。

分享:

    相关文档

    相关产品

文档是否有解决您的问题?

提交成功!非常感谢您的反馈,我们会继续努力做到更好!
反馈提交失败,请稍后再试!

*必选

请至少选择或填写一项反馈信息

字符长度不能超过200

提交反馈 取消

如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨

智能客服提问云社区提问