文档首页/ 政府/ 华为云政务大数据解决方案/ 实施步骤/ 数据集成/ 数据集成概述、工具介绍及入湖范围
更新时间:2024-05-06 GMT+08:00
分享

数据集成概述、工具介绍及入湖范围

概述

数据集成是指将政府部门IT系统中的业务源数据按需通过全量或者增量的方式接入数管平台中,并确保数据的一致性、有效性及适用性。源数据种类可包括结构化数据、非结构化数据。在本次数据治理实施项目中,使用到的数据集成工具为CDM云数据迁移工具。

该过程需要注意的是保障政务数据应收尽收,并且数据已具备相关标准规范,避免出现漏数、脏数等问题。

工具介绍

云数据迁移(Cloud Data Migration,简称CDM),是一个高效、易用的批量数据迁移服务。CDM围绕大数据迁移上云和智能数据湖解决方案,提供了简单易用的迁移能力和多种数据源到数据湖的集成能力,降低了客户数据源迁移和集成的复杂性,有效地提高数据迁移和集成的效率。

关于数据集成工具的具体使用方法可以参考用户手册。

入湖范围

在咨询阶段盘点的数据资产中,政务领域的有效表和业务指标。治理实施项目将聚焦政务领域,结合选取的业务指标,从咨询项目输出的数据资产目录中选取表作为集成入湖范围,并完成数据集成入湖。

选取出来的表及时做好标记,入湖后也要做好记录,避免出现重复入湖动作。

相关文档