实施步骤
数据集成
- 数据源:数据源管理主要进行数据源连接配置&管理。
图1 连接池管理
在连接池管理页面,可以新建、编辑、查询、查看数据源配置信息。图2 新建数据源
在连接池管理页面,单击“新建”,可以新建数据源配置信息,内容包含数据源名称、分类类型、用户名、密码、源类型、IP、端口、库名、数据源描述等。
- 数据集:用于数据的主题域和主题管理,并支持主题下创建数据存储的库表模型。
图3 主题域管理
主题域管理,用于数据的主题域管理,支持新增、编辑、删除等操作。
图4 新建主题域
在主题域管理页面,单击“新建”,可以新建主题域信息。
图5 主题管理
主题管理,用于数据的主题管理,可以新建、编辑、查询、查看主题信息。
图6 新建主题
在主题管理页面,单击“新建”,可以新建主题信息。
图7 数据库管理
数据库管理,用于数据存储的数据库管理,支持新增、编辑、删除等操作。
图8 新建数据库
在数据库管理页面,单击“新建”,可以新建数据库信息。
图9 表管理
表管理,用于数据存储的表模型管理,支持新增、编辑、删除等操作。
图10 新建表
在表管理页面,单击“新建”,可以新建表模型信息。
- 项目管理:项目管理是数据处理集中管理的基本单元,完成具体数据处理任务的集合。该模块主要用于数据采集、处理的可视化编排和执行。
图11 项目管理
项目管理,用于数据处理任务的项目管理,支持新增、编辑、删除等操作。
图12 新建项目
在项目管理页面,单击“新建”,可以新建项目信息。
图13 工作流管理
工作流管理,用于数据采集、处理和流转的流程配置管理,支持新增、编辑、删除、上线、运行等操作。
图14 新建工作流
在工作流管理页面,单击“新建”,可以可视化配置工作流信息。
图15 任务管理
任务管理,用于数据处理任务的管理,支持新增、编辑、删除等操作。
图16 新建任务
在任务管理页面,单击“新建”,可以新建任务信息。
数据治理
- 元模型管理:元数据存储库的数据模型,定义元数据的属性、关系的模型叫做元模型,每类元数据都对应一个元模型。
图17 元模型管理
在元模型管理页面,可以编辑维护库、表、字段元模型信息。
图18 编辑元模型
在元模型管理页面,单击“编辑”,可以编辑元模型信息。
- 元数据管理:元数据管理主要用于组织、存储、维护和利用描述数据的数据(即元数据)。
图19 元数据管理
在元数据管理页面,可以编辑维护库、表、字段元数据信息。
图20 编辑元数据
在元数据管理页面,单击“编辑”,可以编辑元数据信息。
- 元数据分析:元数据分析的主要目的是深入了解数据的各个方面,包括数据的结构、质量、来源、使用方式等,支持查看元数据血缘分析、影响分析等。
图21 元数据分析管理
在元数据分析页面,支持查看库、表、字段的元数据分析。
图22 血缘关系
血缘分析主要用于表示数据与数据之间的关系。主要包括表级血缘关系和字段血缘关系。