华为数据湖 dli_支持的数据源（2.9.2.200）-华为云

支持的数据源（2.9.2.200）

表/文件迁移支持的数据源数据源分类源端数据源对应的目的端数据源说明数据仓库数据仓库服务（DWS）数据仓库：数据仓库服务（DWS），数据湖探索（ DLI ）， MRS ClickHouse Hadoop：MRS HDFS，MRS HBase，MRS Hive 对象存储：对象存储服务（OBS）

来自：帮助中心

查看更多 →
方案概述

该方案基于华为云服务构建，通过成本中心OBS转储能力将成本明细数据定期推送至OBS桶中，数据湖探索DLI服务分析OBS桶中数据并推送至RDS，DataArts Insight智能数据洞察平台读取RDS数据内容，将DLI的分析数据呈现至仪表盘。该方案部署架构如下图所示：图1 云智能看板方案架构图云智能看板功能需要

来自：帮助中心

查看更多 →
支持的数据源（2.9.3.300）

表/文件迁移支持的数据源数据源分类源端数据源对应的目的端数据源说明数据仓库数据仓库服务（DWS）数据仓库：数据仓库服务（DWS），数据湖探索（DLI），MRS ClickHouse Hadoop：MRS HDFS，MRS HBase，MRS Hive 对象存储：对象存储服务（OBS）

来自：帮助中心

查看更多 →
支持的数据源（2.9.2.200）

表/文件迁移支持的数据源数据源分类源端数据源对应的目的端数据源说明数据仓库数据仓库服务（DWS）数据仓库：数据仓库服务（DWS），数据湖探索（DLI），MRS ClickHouse Hadoop：MRS HDFS，MRS HBase，MRS Hive 对象存储：对象存储服务（OBS）

来自：帮助中心

查看更多 →
pyspark样例代码

有四种保存类型： ErrorIfExis：如果已经存在数据，则抛出异常。 Overwrite：如果已经存在数据，则覆盖原数据。 Append：如果已经存在数据，则追加保存。 Ignore：如果已经存在数据，则不做操作。这类似于SQL中的“如果不存在则创建表”。读取RDS上的数据 1 2 3

来自：帮助中心

查看更多 →
数据库、数据仓库、数据湖与华为智能数据湖方案是什么，有哪些区别和联系？

PostgreSQL、云数据库 SQL Server等。非关系型数据库包括：文档数据库服务DDS、云数据库 GeminiDB（兼容Influx、Redis、Mongo以及Cassandra多种协议）等。数据仓库：数据仓库服务DWS。数据湖：云原生大数据MRS、数据湖探索DLI等。数据治理平台：数据治理中心 DataArts

来自：帮助中心

查看更多 →
创建目的端连接

创建目的端连接创建目的端连接是为了将源端数据写入到华为云DLI。使用须知元数据迁移：只需要配置一条连接到DLI SQL队列的连接。数据迁移：需要配置两条连接，分别为连接到DLI SQL队列的连接和连接到DLI通用队列的连接。前提条件已完成准备工作。操作步骤登录迁移中心控制台。

来自：帮助中心

查看更多 →
DLI Hudi元数据

i”。在“数据库”选项中选择要对接的DLI元数据中的数据库，即可对接到DLI元数据。 DLI通用队列对接DLI元数据方法：请参考使用Spark作业访问DLI元数据。 DLI SQL队列对接Lakeformation元数据方法：参考DLI对接LakeFormation。 DL

来自：帮助中心

查看更多 →
终端节点

，不同服务不同区域的终端节点不同，您可以从地区和终端节点中查询所有服务的终端节点。数据湖探索的终端节点如下表所示，请您根据业务需要选择对应区域的终端节点。表1 数据湖探索的终端节点区域名称区域终端节点（Endpoint）华北-北京四 cn-north-4 dli.cn-north-4

来自：帮助中心

查看更多 →
pyspark样例代码

将写好的python代码文件上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。

来自：帮助中心

查看更多 →
资源和成本规划

，具体请参考华为云官网价格：表1 资源和成本规划华为云服务配置示例每月预估花费数据治理中心 DataArts Studio 区域：华北-北京四计费模式：包年包月版本：初级版规格：cdm.medium 4核 8GB 购买量：1 2000元数据迁移服务 CDM 按需计费：2

来自：帮助中心

查看更多 →
监控安全风险

监控安全风险云监控服务为用户的云上资源提供了立体化监控平台。通过云监控您可以全面了解云上的资源使用情况、业务的运行状况，并及时收到异常告警做出反应，保证业务顺畅运行。 DLI服务提供基于云监控服务CES的资源监控能力 DLI已对接云监控服务，提供基于云监控服务的资源监控能力，帮助

来自：帮助中心

查看更多 →
支持的数据源（2.9.2.200）

表/文件迁移支持的数据源数据源分类源端数据源对应的目的端数据源说明数据仓库数据仓库服务（DWS）数据仓库：数据仓库服务（DWS），数据湖探索（DLI），MRS ClickHouse Hadoop：MRS HDFS，MRS HBase，MRS Hive 对象存储：对象存储服务（OBS）

来自：帮助中心

查看更多 →
存储计费

存储计费 DLI数据存储计费模式存储资源是DLI服务内部的存储资源，用于存储数据库和DLI表。支持以下计费模式：按需计费：按需计费是一种后付费模式，DLI支持使用按需计费模式购买数据存储。按照存储在DLI服务中的数据存储量（单位为“GB”）收取存储费用。计费方式自创建起按自然

来自：帮助中心

查看更多 →
附录

融合处理分析服务，支持数据入湖、数据仓库、BI、AI融合等能力。数据治理中心 DataArts Studio：数据治理中心(DataArts Studio)是数据全生命周期一站式开发运营平台，提供数据集成、数据开发、数据治理、数据服务、数据可视化等功能，支持行业知识库智能化建设

来自：帮助中心

查看更多 →
DLI Delta元数据

Lakeformation元数据可在湖仓构建 Lakeformation服务的管理控制台中查看。相关操作 DLI SQL队列对接DLI元数据方法：在DLI管理控制台的SQL编辑器页面的“数据目录”中选择“dli”。在“数据库”选项中选择要对接的DLI元数据中的数据库，即可对接到DLI元数据。 DLI通用队列对接DLI元数据方法：

来自：帮助中心

查看更多 →
支持的数据源（2.9.3.300）

表/文件迁移支持的数据源数据源分类源端数据源对应的目的端数据源说明数据仓库数据仓库服务（DWS）数据仓库：数据仓库服务（DWS），数据湖探索（DLI），MRS ClickHouse Hadoop：MRS HDFS，MRS HBase，MRS Hive 对象存储：对象存储服务（OBS）

来自：帮助中心

查看更多 →
pyspark样例代码

将写好的python代码文件上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。

来自：帮助中心

查看更多 →
华为云大数据上云与实施服务优势？

华为云大数据上云与实施服务优势？高效的迁移工具保障客户业务连续性：云数据迁移CDM服务支持，围绕大数据迁移上云和智能数据湖解决方案，提供了简单易用的迁移能力和多种数据源到数据湖的集成能力。数据迁移工具实现Hive、HBase、HDFS（全量、增量数据）迁移到MRS、DLI，数据

来自：帮助中心

查看更多 →
MRS配置

信息”章节描述。开启Kerberos认证时的相关配置文件参考《从零开始使用Kerberos认证集群》中的“创建安全集群并登录其Manager”章节创建Kerberos认证集群。参考“创建角色和用户”章节添加用户并赋权。参考《使用HBase客户端》使用1中创建的用户认证登录。“人机”用户第一次登录时需修改密码。

来自：帮助中心

查看更多 →
pyspark样例代码

有四种保存类型： ErrorIfExis：如果已经存在数据，则抛出异常。 Overwrite：如果已经存在数据，则覆盖原数据。 Append：如果已经存在数据，则追加保存。 Ignore：如果已经存在数据，则不做操作。这类似于SQL中的“如果不存在则创建表”。读取DWS上的数据 1 2 3

来自：帮助中心

查看更多 →