数据资源管理
- 数据资源概览
资源概览对数据平台内的数据项目、数据源、数据表、API、指标、维度等进行统计,并反映存储资源消耗情况、数据价值表排行、元数据质量缺陷统计等情况。
图1 数据资源概览1
同时,可以查看不同数据源类型的数据源数量、表数量、数据量以及接入连通性等信息。
图2 数据资源概览2
- 热点资源盘点
根据 API 查询次数、被引用次数及收藏次数,对数据资产进行热点资源排行,及时发现闲置资源,以做好资源盘活工作。
图3 热点资源盘点
- 数据地图
通过数据地图,可以一目了然的总览数据模型及指标在不同业务主题域下的分布情况。
图4 数据地图1
用户可以依次展开想要探索的主题域、数据表,层层下钻,定位到目标表后,查看表详情。
图5 数据地图2
图6 数据地图3
图7 数据地图4
- 数据资源编目
基于元数据采集获取的企业数据资源清单后,可以进行编目管理,使得数据资源更易被用户所检索、调用。
图8 数据资源编目
- 数据资源详情
在全部资产中,可以查看所有数据表、数据模型、指标维度及 HDFS 上的文件。其中,数据表中可以进一步查看字段信息、索引信息、元数据变更信息、关联的数据产出任务、数据血缘关系等详情。
图9 数据资源详情
- 数据血缘分析
通过数据血缘分析,可以分析问题表的数据质量问题来自于上游的哪些数据表和字段。
图10 数据血缘分析