数据湖dli_DLI Spark-华为云

DLI Spark

datasource.css DLI 内部相关模块： sys.res.dli-v2 sys.res.dli sys.datasource.dli-inner-table 访问元数据是是否通过Spark作业访问元数据。具体请参考使用Spark作业访问DLI元数据。表2 高级参数参数

来自：帮助中心

查看更多 →
怎样排查DLI计费异常？

计费详情可参考《数据湖探索价格详情》。如果在扣费时间段内没有执行过作业，则请继续排查是否是因为存储了大量数据而产生的计费。具体操作请参考数据存储。数据存储进入“数据管理”>“库表管理”页面。查看所建的数据库中是否有存储在DLI中的数据：单击所要查看的数据库名，进入对应的“表管理”页面；

来自：帮助中心

查看更多 →
功能总览

特定类型的数据，使得数据可以被有效地查询和分析。数据库是一个框架，表是其实质内容。一个数据库包含一个或者多个表。 · 元数据：元数据（Metadata）是用来定义数据类型的数据。主要是描述数据自身信息，包含源、大小、格式或其它数据特征。数据库字段中，元数据用于诠释数据仓库的内容。

来自：帮助中心

查看更多 →
身份认证与访问控制

租户管理员。操作权限：具有所有云服务的管理和使用权限。创建后，可通过ACL赋权给其他子用户使用。作用范围：项目级服务。系统角色 DLI Service Administrator DLI服务管理员。操作权限：具有数据湖探索服务队列、数据的管理和使用权限。创建后，可通过ACL赋权给其他子用户使用。

来自：帮助中心

查看更多 →
终端节点

，不同服务不同区域的终端节点不同，您可以从地区和终端节点中查询所有服务的终端节点。数据湖探索的终端节点如下表所示，请您根据业务需要选择对应区域的终端节点。表1 数据湖探索的终端节点区域名称区域终端节点（Endpoint）华北-北京四 cn-north-4 dli.cn-north-4

来自：帮助中心

查看更多 →
监控安全风险

监控安全风险云监控服务为用户的云上资源提供了立体化监控平台。通过云监控您可以全面了解云上的资源使用情况、业务的运行状况，并及时收到异常告警做出反应，保证业务顺畅运行。 DLI服务提供基于云监控服务CES的资源监控能力 DLI已对接云监控服务，提供基于云监控服务的资源监控能力，帮助

来自：帮助中心

查看更多 →
DLI资源

DLI资源资源是服务中存在的对象。在DLI中，资源如下，您可以在创建自定义策略时，通过指定资源路径来选择特定资源。表1 DLI的指定资源与对应路径资源类型资源名称资源路径 queue DLI队列 queues.queuename database DLI数据库 databases

来自：帮助中心

查看更多 →
支持的数据源（2.9.2.200）

表/文件迁移支持的数据源数据源分类源端数据源对应的目的端数据源说明数据仓库数据仓库服务（DWS）数据仓库：数据仓库服务（DWS），数据湖探索（DLI）， MRS ClickHouse Hadoop：MRS HDFS，MRS HBase，MRS Hive 对象存储：对象存储服务（OBS）

来自：帮助中心

查看更多 →
支持的数据源（2.9.2.200）

表/文件迁移支持的数据源数据源分类源端数据源对应的目的端数据源说明数据仓库数据仓库服务（DWS）数据仓库：数据仓库服务（DWS），数据湖探索（DLI），MRS ClickHouse Hadoop：MRS HDFS，MRS HBase，MRS Hive 对象存储：对象存储服务（OBS）

来自：帮助中心

查看更多 →
pyspark样例代码

将写好的python代码文件上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。

来自：帮助中心

查看更多 →
pyspark样例代码

有四种保存类型： ErrorIfExis：如果已经存在数据，则抛出异常。 Overwrite：如果已经存在数据，则覆盖原数据。 Append：如果已经存在数据，则追加保存。 Ignore：如果已经存在数据，则不做操作。这类似于SQL中的“如果不存在则创建表”。读取RDS上的数据 1 2 3

来自：帮助中心

查看更多 →
scala样例代码

将写好的代码生成jar包，上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。

来自：帮助中心

查看更多 →
MRS配置

信息”章节描述。开启Kerberos认证时的相关配置文件参考《从零开始使用Kerberos认证集群》中的“创建安全集群并登录其Manager”章节创建Kerberos认证集群。参考“创建角色和用户”章节添加用户并赋权。参考《使用HBase客户端》使用1中创建的用户认证登录。“人机”用户第一次登录时需修改密码。

来自：帮助中心

查看更多 →
支持的数据源（2.9.3.300）

表/文件迁移支持的数据源数据源分类源端数据源对应的目的端数据源说明数据仓库数据仓库服务（DWS）数据仓库：数据仓库服务（DWS），数据湖探索（DLI），MRS ClickHouse Hadoop：MRS HDFS，MRS HBase，MRS Hive 对象存储：对象存储服务（OBS）

来自：帮助中心

查看更多 →
支持的数据源（2.9.2.200）

表/文件迁移支持的数据源数据源分类源端数据源对应的目的端数据源说明数据仓库数据仓库服务（DWS）数据仓库：数据仓库服务（DWS），数据湖探索（DLI），MRS ClickHouse Hadoop：MRS HDFS，MRS HBase，MRS Hive 对象存储：对象存储服务（OBS）

来自：帮助中心

查看更多 →
pyspark样例代码

有四种保存类型： ErrorIfExis：如果已经存在数据，则抛出异常。 Overwrite：如果已经存在数据，则覆盖原数据。 Append：如果已经存在数据，则追加保存。 Ignore：如果已经存在数据，则不做操作。这类似于SQL中的“如果不存在则创建表”。读取DWS上的数据 1 2 3

来自：帮助中心

查看更多 →
DLI连接

DLI连接介绍通过DLI连接，可以导入数据到数据湖探索（DLI）服务， CDM 暂不支持从DLI服务导出数据。连接样例 { "links": [ { "link-config-values": { "configs":

来自：帮助中心

查看更多 →
DLI连接

DLI连接介绍通过DLI连接，可以导入数据到数据湖探索（DLI）服务，CDM暂不支持从DLI服务导出数据。连接样例 { "links": [ { "link-config-values": { "configs":

来自：帮助中心

查看更多 →
数据湖建设和持续运营

问控制，为业务数据的安全性提供有力保障。建议搭配服务 MapReduce服务（MRS）数据仓库服务 GaussDB （DWS）数据治理中心 DataArts Studio 数据湖探索（DLI）支持情况请咨询对应服务。父主题：应用场景

来自：帮助中心

查看更多 →
MaxCompute迁移至DLI数据校验

MaxCompute迁移至DLI数据校验本文主要介绍将阿里云 MaxCompute数据迁移至华为云数据湖探索 DLI后，使用迁移中心 MgC进行数据一致性校验的步骤和方法。准备工作需要先在源端内网环境中安装用于配合数据校验的工具Edge并注册用户，方法请参见安装Linux版本的Edge工具。

来自：帮助中心

查看更多 →
支持的数据源（2.9.3.300）

表/文件迁移支持的数据源数据源分类源端数据源对应的目的端数据源说明数据仓库数据仓库服务（DWS）数据仓库：数据仓库服务（DWS），数据湖探索（DLI），MRS ClickHouse Hadoop：MRS HDFS，MRS HBase，MRS Hive 对象存储：对象存储服务（OBS）

来自：帮助中心

查看更多 →