数据湖探索 DLI

数据湖探索(Data Lake Insight,简称DLI)是完全兼容Apache Spark和Apache Flink生态, 实现批流一体的Serverless大数据计算分析服务。DLI支持多模引擎,企业仅需使用SQL或程序就可轻松完成异构数据源的批处理、流处理、内存计算、机器学习等,挖掘和探索数据价值

 
进入控制台立即购买帮助文档DLI开发者社区1对1咨询                
               

           

    企业级spark云主机配置多少钱 更多内容
  • 导入并配置Spark样例工程

    Scala SparkOnMultiHbaseScalaExample Spark同时访问两个HBase Scala SparkRExample 安装SparkR R SparkOnHudiJavaExample 使用Spark执行Hudi基本操作 Java SparkOnHudiPythonExample

    来自:帮助中心

    查看更多 →

  • 导入并配置Spark样例工程

    若需要在本地Windows调测Spark样例代码,需参考准备Spark连接集群配置文件获取各样例项目所需的配置文件,并手动将配置文件导入到Spark样例工程的配置文件目录中。 安装IntelliJ IDEA和JDK工具后,需要在IntelliJ IDEA中配置JDK。 打开IntelliJ

    来自:帮助中心

    查看更多 →

  • 配置SparkSQL业务用户权限

    配置SparkSQL业务用户权限 操作场景 SparkSQL业务还可能需要关联使用其他组件,例如Spark on HBase需要HBase权限。以下介绍SparkSQL关联HBase服务的操作。 前提条件 完成Spark客户端的安装,例如安装目录为“/opt/client”。 获

    来自:帮助中心

    查看更多 →

  • 配置Spark SQL开启Adaptive Execution特性

    Manager系统,选择“集群 > 服务 > Spark2x > 配置”,单击“全部配置”,搜索以下参数。 参数 说明 默认值 spark.sql.adaptive.enabled 配置是否启用自适应执行功能。 注意:AQE特性与DPP(动态分区裁剪)特性同时开启时,SparkSQL任务执行中会优先执

    来自:帮助中心

    查看更多 →

  • HDFS企业级能力增强

    HDFS企业级能力增强 配置DataNode节点容量不一致时的副本放置策略 配置DataNode预留磁盘百分比 配置NameNode黑名单功能 配置Hadoop数据传输加密 父主题: 使用HDFS

    来自:帮助中心

    查看更多 →

  • HBase企业级能力增强

    HBase企业级能力增强 配置HBase全局二级索引提升查询效率 配置HBase本地二级索引提升查询效率 增强HBase BulkLoad工具数据迁移能力 使用Spark BulkLoad工具同步数据到HBase表中 配置HBase冷热分离 配置RSGroup管理RegionServer资源

    来自:帮助中心

    查看更多 →

  • Kafka企业级能力增强

    Kafka企业级能力增强 配置Kafka高可用和高可靠 配置Kafka数据安全传输协议 配置Kafka数据均衡工具 配置外网客户端访问Kafka Broker 父主题: 使用Kafka

    来自:帮助中心

    查看更多 →

  • Yarn企业级能力增强

    Yarn企业级能力增强 配置Yarn权限控制开关 手动指定运行Yarn任务的用户 配置AM失败重试次数 配置AM自动调整分配内存 配置AM作业自动保留 配置Yarn数据访问通道协议 配置自定义调度器的WebUI 配置NodeManager角色实例使用的资源 配置ResourceM

    来自:帮助中心

    查看更多 →

  • Doris企业级能力增强

    Doris企业级能力增强 配置Doris高可用功能 配置Doris支持多源数据 配置Doris多租户 Doris冷热分离 Doris慢查询语句监控 父主题: 使用Doris

    来自:帮助中心

    查看更多 →

  • 配置矢量化读取ORC数据

    幅提升ORC数据读取性能。在Spark2.3版本中,SparkSQL支持矢量化读取ORC数据(这个特性在Hive的历史版本中已经得到支持)。矢量化读取ORC格式的数据能够获得比传统读取方式数倍的性能提升。 该特性可以通过下面的配置项开启: “spark.sql.orc.enabl

    来自:帮助中心

    查看更多 →

  • 配置矢量化读取ORC数据

    00。 “spark.sql.orc.impl”:指定使用Hive还是Spark SQL native作为SQL执行引擎来读取ORC数据,默认为hive。 配置参数 登录 FusionInsight Manager系统,选择“集群 > 服务 > Spark2x > 配置”,单击“全部配置”,搜索以下参数。

    来自:帮助中心

    查看更多 →

  • 为华为云主机安装Agent

    在页面右上角,单击“安装主机安全Agent”,弹出“安装主机安全Agent”对话框。 选择“ 弹性云服务器 E CS 安装”,并单击“开始配置”。 选择安装方式。 选择安装模式:命令行安装 选择 服务器 操作系统:Linux 选择安装数量:单台 (可选)选择需要打通网络安装Agent的服务器,并单击“下一步”。

    来自:帮助中心

    查看更多 →

  • 配置Spark Streaming对接Kafka可靠性

    允许开启对接Kafka可靠性功能。 配置描述 在Spark客户端的“spark-defaults.conf”配置文件中进行设置。 表1 参数说明 参数 说明 默认值 spark.streaming.Kafka.reliability Spark Streaming对接Kafka是否开启可靠性功能:

    来自:帮助中心

    查看更多 →

  • 配置对接Kafka可靠性

    允许开启对接Kafka可靠性功能。 配置描述 在Spark客户端的“spark-defaults.conf”配置文件中进行设置。 表1 参数说明 参数 说明 默认值 spark.streaming.Kafka.reliability Spark Streaming对接Kafka是否开启可靠性功能:

    来自:帮助中心

    查看更多 →

  • 配置创建Hive内部表时不能指定Location

    notallowlocation”,“值”为“true”,修改后重启所有Hive实例。 是否需要在Spark/Spark2x客户端中启用此功能? 是,重新下载并安装Spark/Spark2x客户端。 否,操作结束。 父主题: Hive企业级能力增强

    来自:帮助中心

    查看更多 →

  • 使用Ranger时适配第三方JDK

    在这个场景下,需要进行以下操作,将集群中的证书导入第三方JDK或者JRE中。 配置方法 导出集群中的证书: 安装集群客户端,例如安装路径为“/opt/client”。 执行以下命令,切换到客户端安装目录。 cd /opt/client 执行以下命令配置环境变量。 source bigdata_env 生成证书文件

    来自:帮助中心

    查看更多 →

  • 使用Ranger时适配第三方JDK

    在这个场景下,需要进行以下操作,将集群中的证书导入第三方JDK或者JRE中。 配置方法 导出集群中的证书: 安装集群客户端,例如安装路径为“/opt/client”。 执行以下命令,切换到客户端安装目录。 cd /opt/client 执行以下命令配置环境变量。 source bigdata_env 生成证书文件

    来自:帮助中心

    查看更多 →

  • Flume企业级能力增强

    Flume企业级能力增强 使用Flume客户端加密工具 配置Flume对接安全模式Kafka 父主题: 使用Flume

    来自:帮助中心

    查看更多 →

  • Spark SQL常用配置项说明

    Spark SQL常用配置项说明 本章节为您介绍 DLI 批作业SQL语法的常用配置项。 表1 常用配置项 名称 默认值 描述 spark.sql.files.maxRecordsPerFile 0 要写入单个文件的最大记录数。如果该值为零或为负,则没有限制。 spark.sql.shuffle

    来自:帮助中心

    查看更多 →

  • 准备Spark连接集群配置文件

    ntConfig_ConfigFiles.tar”,继续解压该文件。 进入客户端配置文件解压路径“*\Spark\config”,获取Spark配置文件,并所有的配置文件导入到Spark样例工程的配置文件目录中(通常为“resources”文件夹)。 复制解压目录下的“hosts

    来自:帮助中心

    查看更多 →

  • 配置Spark通过IAM委托访问OBS

    tables; 图3 Spark2x验证返回已创建的表名 使用“Ctrl + C”退出spark beeline。 集群安装后使用spark sql 使用安装客户端用户登录客户端安装节点。 配置环境变量。 source 客户端安装目录/bigdata_env 修改配置文件: vim 客

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了