枢纽元模型V2.0
枢纽元模型V2.0中定义的所有实体
业务架构使用业务元数据,技术架构使用技术元数据。
| 实体中文名 | 架构分类 | 元数据分类 | 说明 |
|---|---|---|---|
| 行政领域 | 业务架构 | Business | 用于描述行政领域,例如政府的公安/卫健等,或者企业的财经/人力资源等。 |
| 行政单元 | 业务架构 | Business | 用于描述行政单元,如政府的省/市/区、企业的集团/分支机构、法人实体等。 |
| 应用 | 应用架构 | Business | 应用是数据资产运营枢纽中对IT系统的统称,包括文件应用、业务系统应用、企业应用、数据仓库应用等。 |
| 属性 | 数据架构/信息架构 | Business | 描述业务对象的数据特征,是数据最基本的单元。 |
| 业务对象 | 数据架构/信息架构 | Business | 业务领域重要的人、事、物,承载了业务运作和管理涉及的重要信息。 |
| 卡片 | 应用架构 | Business | 报表由多个可视化组件组成,一个可视化组件称为卡片。 |
| 数据集容器 | 技术架构 | Technical | 包括一组数据集的逻辑库。 |
| 数据平台实例 | 技术架构 | Technical | 数据源是元数据的来源。包括以下几类来源:关系型数据库(比如MySQL、Oracle)、对象存储(比如华为云OBS)、企业应用(比如金蝶ERP)、BI软件(比如四方伟业BI、帆软BI)、大数据存储(比如Hive、HDFS)、消息队列(比如kafka)、ETL工具(比如AWS Glue)、时序数据库(比如influx)等。数据源又称数据平台实例。 |
| 数据集 | 技术架构 | Technical | 代表了数据的集合,通常指数据库中的表/视图、流处理系统中的流、数据湖系统中以文件或文件夹形式存在的数据集合等。 |
| 数据标准 | 业务架构 | Business | 定义组织层面需共同遵守的属性层数据含义和业务规则,是组织层面对某个数据的共同理解,这些理解一旦确定下来,就应作为组织层面的标准在组织内被共同遵守。 |
| 团队 | 业务架构 | Business | 数据资产管理和运营用户旅程中的团队参与方。 |
| 逻辑数据实体 | 数据架构/信息架构 | Governance | 具有一定逻辑关系的数据属性的集合。 |
| 报表 | 应用架构 | Business | 以特定格式展现数据的一种可视化报告,能直观地展现业务分析结果,用于支撑业务决策。 |
| 报表分组 | 应用架构 | Business | 对报表的分类信息。 |
| 数据集字段 | 数据架构/信息架构 | Technical | 数据集中的每一列的特定变量对应一个数据集字段。 |
| 空间 | 技术架构 | Business | 用于描述数据分析师的工作空间,此空间为一个逻辑概念,空间中涵盖了“数据分析师团队、团队拥有的数据底座、有访问权限的数据资产、数据开发工具、数据应用”等关联概念。 |
| 主题域 | 数据架构/信息架构 | Business | 公司顶层信息分类,通过数据视角体现公司最高层关注的业务领域。 |
| 主题域分组 | 数据架构/信息架构 | Business | 互不重叠数据的高层面的分类,用于管理下一级的业务对象。 |
| 用户 | 业务架构 | Business | 数据资产管理和运营用户旅程中的个人参与方,如数据管家、数据分析师、数据普查员等。 |
实体定义
ABM平台,基于[MOF V2.5.1]的实现中,要求所有实体具备三个基础属性,如表2所示:
枢纽元模型V2.0中定义的所有特征
| 特征名 | 关联实体 | 说明 |
|---|---|---|
| 行政领域标识 | 行政领域 | 行政领域的唯一标识。 |
| 行政领域信息 | 行政领域 | 行政领域的信息,包括预置的信息和用户自定义的信息,预置的信息无法修改,只允许修改用户自定义的信息。 |
| 行政单元信息 | 行政单元 | 行政单元的信息。 |
| 应用信息 | 应用 | 描述应用的关键信息。 |
| 应用标识 | 应用 | 应用的唯一标识。 |
| 应用状态 | 应用 | 应用状态信息。 |
| 数据资产开发状态 | 逻辑数据实体 | 数据资产开发状态。 |
| BI报告信息 | 报表 | BI报告信息。 |
| 卡片信息 | 卡片 | 卡片详情。 |
| 业务系统承建信息 | 应用 | 业务系统承建信息。 |
| 数据分类信息 | 逻辑数据实体 | 数据分类。(FabricMetamodelV2.1中计划改为dataClassification) |
| 数据平台实例信息 | 数据平台实例 | 数据平台实例信息。 |
| 数据平台实例元数据采集统计信息 | 数据平台实例 | 数据平台实例元数据采集统计信息,此特征尚未被使用。 |
| 数据集对应的统计信息 | 数据集 | 数据集对应的统计信息,主要是记录占用存储空间等。 |
| 数据标准信息 | 数据标准 | 数据标准详细信息。 |
| 数据分类信息 | 数据集 | 数据分类信息。 |
| 数据仓库信息 | 数据平台实例 | 数据仓库描述信息。 |
| 数据资产信息 | 属性 业务对象 逻辑数据实体 主题域分组 主题域 | 数据资产描述信息。 |
| 数据集字段信息 | 数据集字段 | 数据集字段信息。 |
| 团队信息 | 分组 | 团队信息。 |
| 应用托管信息 | 应用 | 应用托管信息。 |
| 实体维护信息 | 行政领域 行政单元 应用 属性 业务对象 卡片 数据集 逻辑数据实体 报表 报表分组 空间 主题域分组 主题域 | 实体维护信息。 |
| 报表访问信息 | 报表 | 报表访问信息。 |
| 报表分组信息 | 报表分组 | 报表分组信息。 |
| 密级和隐私信息 | 属性 数据集 逻辑数据实体 数据集字段 | 密级和隐私信息。 |
| 空间信息 | 空间 | 空间信息。 |
| 用户账号信息 | 用户 | 用户账号信息。 |
| 用户信息 | 用户 | 用户信息。 |
枢纽元模型V2.0关系
枢纽元模型V2.0关系(Relationships)的使用需要遵循以下原则:
- 关系可以被用于实体与实体之间建立联系,形成实体联接。
- 关系可以被用于实体与特征之间建立联系,形成特征联接。实体和特征之间仅允许使用组合关系(Composition)。
- 两个实体之间允许存在多个关系,表示不同的语义。
- 对于一对多的关系,且目标实体数量较多时,建议建立源实体和目标实体之间的“被关系”。比如业务对象包含多个逻辑实体,定义“逻辑实体-业务对象”之间的关系为被包含。
| 关系中文名 | 说明 |
|---|---|
| 被包含 | 描述实体间的包含关系。 |
| 被拥有 | 描述实体间的拥有关系。 |
| 被管理 | 描述实体间的管理关系。 |
| 被消费 | 描述实体间的消费关系。 |
| 为其上游 | 描述数据集之间的血缘关系。 |
| 组合 | 描述实体和特征之间的组合关系。 |
枢纽元模型V2.0实体联接定义
| 源类实体 | 目标类实体 | 关系名称 | 关系层次 | 说明 |
|---|---|---|---|---|
| 行政领域 | 行政单元 | 被包含 | 多对一 | 数据普查目录中,手工实现行政单元和行政领域的关联。 |
| 应用 | 行政领域 | 关联于 | 多对一 | 数据普查目录中,手工实现行政领域和应用的关联。 |
| 应用 | 用户 | 被拥有 | 多对一 | 注册应用时选择应用责任人实现应用和用户的关联。 |
| 属性 | 数据标准 | 关联于 | 多对一 | 数据资产目录中,手工实现关联属性和数据标准的关系。 |
| 属性 | 逻辑数据实体 | 被包含 | 多对一 | 数据资产目录中,手工实现关联属性和逻辑数据实体的关系。 |
| 属性 | 数据集字段 | 关联于 | 一对一 | 数据资产目录中,为属性注册字段时创建属性和数据集字段的关系。 |
| 业务对象 | 主题域 | 被包含 | 多对一 | 数据资产目录中,手工实现关联业务对象和主题域的关系。 |
| 业务对象 | 用户 | 被拥有 | 多对一 | 数据资产目录配置时,为业务对象设置数据owner时创建业务对象和用户的关系。 |
| 业务对象 | 用户 | 被管理 | 多对一 | 数据资产目录配置时,为业务对象设置数据管家时创建业务对象和用户的关系。 |
| 卡片 | 应用 | 被包含 | 多对一 | 应用中包含多个卡片。当前枢纽元模型V2.0尚不支持此功能。 |
| 数据集容器 | 数据集容器 | 被包含 | 多对一 | 采集技术元数据后,会自动生成数据集容器之间包含关系。 |
| 数据平台实例 | 应用 | 关联于 | 多对一 | 数据普查目录中,手工实现关联数据平台实例和应用的关系。 |
| 数据集 | 业务对象 | 被包含 | 多对一 | 已失效。枢纽元模型V2.1中计划删除此实体联接。 |
| 数据集 | 数据平台实例 | 被包含 | 多对一 | 采集技术元数据后,会自动生成数据集和数据平台实例关联关系。 |
| 数据集 | 数据集容器 | 被包含 | 多对一 | 采集技术元数据后,会自动生成数据集和数据集容器关联关系。 |
| 数据集 | 数据集 | 为其上游 | 多对多 | 采集数据血缘后,会生成数据集之间血缘关系。 当前FabricMetamodelV2.0尚不支持此功能。 |
| 数据集 | 报表 | 被消费 | 多对一 | 制作报表时生成数据集和报表的关系。 |
| 数据集 | 用户 | 被拥有 | 多对一 | 数据普查目录中,设置数据集的数据owner生成数据集和用户的关系。 |
| 数据集 | 用户 | 被管理 | 多对一 | 数据普查目录中,设置数据集的数据管家生成数据集和用户的关系。 |
| 数据标准 | 用户 | 被管理 | 多对一 | 创建数据标准时设置数据管家时关联数据标准和用户的关系。 |
| 分组 | 主题域分组 | 关联于 | 多对多 | 创建主题域分组时,自动创建一个分组与主题域分组关联。FabricMetamodelV2.1中此关系层次将改为1:1。 |
| 逻辑数据实体 | 业务对象 | 被包含 | 多对一 | 数据资产目录中,手工实现关联逻辑数据实体和业务对象的关系。 |
| 逻辑数据实体 | 数据集 | 关联于 | 一对多 | 数据资产目录中,为逻辑数据实体注册物理表时创建逻辑数据实体和数据集的关系。 |
| 逻辑数据实体 | 用户 | 被拥有 | 多对一 | 数据资产目录配置时,为逻辑数据实体设置数据管家时创建逻辑数据实体和用户的关系。 |
| 逻辑数据实体 | 用户 | 被管理 | 多对一 | 数据资产目录配置时,为逻辑数据实体设置数据owner时创建逻辑数据实体和用户的关系。 |
| 主题域 | 主题域分组 | 被包含 | 多对一 | 数据资产目录中,手工实现关联主题域和主题域分组的关系。 |
| 主题域 | 用户 | 被拥有 | 多对一 | 数据资产目录中,为主题域设置数据owner时创建主题域和用户的关系。 |
| 报表分组 | 空间 | 被包含 | 多对一 | 在空间中创建报表分组时关联报表分组和空间的关系。 |
| 报表 | 报表分组 | 被包含 | 多对一 | 创建报表时选择报表分组关联报表分组和报表的关系。 |
| 报表 | 用户 | 被拥有 | 多对一 | 创建报表时自动创建报表和用户的关系。 |
| 空间 | 用户 | 被拥有 | 多对一 | 创建空间时设置空间owner关联空间和用户的关系。 |
| 数据集字段 | 数据集 | 被包含 | 多对一 | 采集技术元数据后,会自动生成数据集和数据集字段关联关系。 |
| 数据集字段 | 数据标准 | 关联于 | 多对一 | 数据普查目录中,手工实现关联数据集字段和数据标准的关系。 |
| 用户 | 分组 | 被包含 | 多对一 | 团队管理中,在团队中添加成员时创建用户和分组的关系。 |