什么是数据治理中心DataArts Studio
企业数字化转型面临的挑战
企业在进行数据管理时,通常会遇到下列挑战。
- 数据治理的挑战
- 缺乏企业数据体系标准和数据规范定义的方法论,数据语言不统一。
- 缺乏面向普通业务人员的高效、准确的数据搜索工具,数据找不到。
- 缺乏技术元数据与业务元数据的关联,数据读不懂。
- 缺乏数据的质量管控和评估手段,数据不可信。
- 数据运营的挑战
- 数据运营效率低,业务环境的快速变化带来大量多样化的数据分析报表需求,因为缺乏高效的数据运营工具平台,数据开发周期长、效率低,不能满足业务运营决策人员的诉求。
- 数据运营成本高,数据未服务化,导致数据拷贝多、数据口径不一致,同时数据重复开发,造成资源浪费。
- 数据创新的挑战
- 企业内部存在大量数据孤岛,导致数据不共享、不流通,无法实现跨领域的数据分析与数据创新。
- 数据的应用还停留在数据分析报表阶段,缺乏基于数据反哺业务推动业务创新的解决方案。
什么是DataArts Studio?
数据治理中心DataArts Studio是为了应对上述挑战、针对企业数字化运营诉求提供的数据全生命周期管理、具有智能数据管理能力的一站式治理运营平台,包含数据集成、数据开发等功能,支持行业知识库智能化建设,支持大数据存储、大数据计算分析引擎等数据底座,帮助企业快速构建从数据接入到数据分析的端到端智能数据系统,消除数据孤岛,统一数据标准,加快数据变现,实现数字化转型。
产品架构如图1所示。
如图所示,DataArts Studio基于数据湖底座,提供数据集成、开发、治理、开放等能力。DataArts Studio支持对接数据湖与数据库云服务作为数据湖底座,例如数据湖探索(Data Lake Insight,简称DLI)、MRS Hive、数据仓库服务DWS等,也支持对接企业传统数据仓库,例如Oracle、Greenplum等。
DataArts Studio包含如下功能组件:
- 管理中心
提供DataArts Studio数据连接管理的能力,将DataArts Studio与数据湖底座进行对接,用于数据开发等活动。
- 数据集成
数据集成提供20+简单易用的迁移能力和多种数据源到数据湖的集成能力,全向导式配置和管理,支持单表、整库、增量、周期性数据集成。
- 数据开发
大数据开发环境,降低用户使用大数据的门槛,帮助用户快速构建大数据处理中心。支持数据建模、数据集成、脚本开发、工作流编排等操作,轻松完成整个数据的处理分析流程。