数据湖探索 DLI

数据湖探索(Data Lake Insight,简称DLI)是完全兼容Apache Spark和Apache Flink生态, 实现批流一体的Serverless大数据计算分析服务。DLI支持多模引擎,企业仅需使用SQL或程序就可轻松完成异构数据源的批处理、流处理、内存计算、机器学习等,挖掘和探索数据价值

 
进入控制台立即购买帮助文档DLI开发者社区1对1咨询                
               

           

    企业级Spark 更多内容
  • Spark SQL企业级能力增强

    Spark SQL企业级能力增强 配置矢量化读取ORC数据 配置过滤掉分区表中路径不存在的分区 配置Drop Partition命令支持批量删除 配置Hive表分区动态覆盖 配置Spark SQL开启Adaptive Execution特性 父主题: 使用Spark/Spark2x

    来自:帮助中心

    查看更多 →

  • Spark Core企业级能力增强

    Spark Core企业级能力增强 配置Spark HA增强高可用 配置Spark Native引擎 配置Spark事件队列大小 配置parquet表的压缩格式 使用Ranger时适配第三方JDK 使用Spark小文件合并工具说明 使用Spark小文件合并工具说明 配置流式读取Spark

    来自:帮助中心

    查看更多 →

  • Spark Core企业级能力增强

    Spark Core企业级能力增强 配置Spark HA增强高可用 配置Spark事件队列大小 配置parquet表的压缩格式 使用Ranger时适配第三方JDK 使用Spark小文件合并工具说明 配置流式读取Spark Driver执行结果 父主题: 使用Spark2x( MRS

    来自:帮助中心

    查看更多 →

  • Spark SQL企业级能力增强

    Spark SQL企业级能力增强 配置矢量化读取ORC数据 配置过滤掉分区表中路径不存在的分区 配置Hive表分区动态覆盖 配置Spark SQL开启Adaptive Execution特性 配置SparkSQL的分块个数 父主题: 使用Spark2x(MRS 3.x及之后版本)

    来自:帮助中心

    查看更多 →

  • Spark Streaming企业级能力增强

    Spark Streaming企业级能力增强 配置Kafka后进先出 配置对接Kafka可靠性 父主题: 使用Spark2x(MRS 3.x及之后版本)

    来自:帮助中心

    查看更多 →

  • Spark Streaming企业级能力增强

    Spark Streaming企业级能力增强 配置Spark Streaming对接Kafka时数据后进先出功能 配置Spark Streaming对接Kafka可靠性 配置Structured Streaming使用RocksDB做状态存储 父主题: 使用Spark/Spark2x

    来自:帮助中心

    查看更多 →

  • 使用Spark2x(MRS 3.x及之后版本)

    使用Spark2x(MRS 3.x及之后版本) Spark用户权限管理 Spark客户端使用实践 配置Spark读取HBase表数据 配置Spark任务不获取HBase Token信息 Spark Core企业级能力增强 Spark SQL企业级能力增强 Spark Streaming企业级能力增强

    来自:帮助中心

    查看更多 →

  • 使用Spark/Spark2x

    使用Spark/Spark2x Spark使用说明 Spark用户权限管理 Spark客户端使用实践 访问Spark WebUI界面 使用代理用户提交Spark作业 配置Spark读取HBase表数据 配置Spark任务不获取HBase Token信息 Spark Core企业级能力增强

    来自:帮助中心

    查看更多 →

  • 企业级QoS功能

    基本操作 开启企业级QoS功能 申请共享带宽时开启,请参考申请共享带宽申请共享带宽,勾选“企业级QoS功能”。 图1 开启企业级QoS功能 已存在的共享带宽,可在共享带宽列表操作列单击“更多 > 开启企业级QoS功能”。 图2 开启企业级QoS功能 关闭企业级QoS功能 在共享带宽列表操作列单击“更多

    来自:帮助中心

    查看更多 →

  • 企业级特性介绍

    企业级特性介绍 GeminiDB Redis接口基于云原生分布式架构,实现了计算与存储分离,完全兼容社区版Redis7.0、6.2(包含6.2.x)、5.0及以下版本,提供了更多的企业级特性。 资源独享,分片不限流 计算节点部署在独享容器,租户隔离,稳定性高。面对高并发流量,节点不被限流。

    来自:帮助中心

    查看更多 →

  • HDFS企业级能力增强

    HDFS企业级能力增强 配置DataNode节点容量不一致时的副本放置策略 配置DataNode预留磁盘百分比 配置从NameNode支持读操作 配置NameNode黑名单功能 配置Hadoop数据传输加密 父主题: 使用HDFS

    来自:帮助中心

    查看更多 →

  • Doris企业级能力增强

    Doris企业级能力增强 配置Doris高可用功能 配置Doris支持多源数据 父主题: 使用Doris

    来自:帮助中心

    查看更多 →

  • HBase企业级能力增强

    HBase企业级能力增强 配置HBase全局二级索引提升查询效率 配置HBase本地二级索引提升查询效率 增强HBase BulkLoad工具数据迁移能力 配置HBase冷热分离 配置RSGroup管理RegionServer资源 查看HBase慢请求和超大请求信息 父主题: 使用HBase

    来自:帮助中心

    查看更多 →

  • Kafka企业级能力增强

    Kafka企业级能力增强 配置Kafka高可用和高可靠 配置Kafka数据安全传输协议 配置Kafka数据均衡工具 配置外网客户端访问Kafka Broker 父主题: 使用Kafka

    来自:帮助中心

    查看更多 →

  • Yarn企业级能力增强

    Yarn企业级能力增强 配置Yarn权限控制开关 手动指定运行Yarn任务的用户 配置AM失败重试次数 配置AM自动调整分配内存 配置AM作业自动保留 配置Yarn数据访问通道协议 配置自定义调度器的WebUI 配置NodeManager角色实例使用的资源 配置ResourceM

    来自:帮助中心

    查看更多 →

  • Spark

    Spark Spark jar包冲突列表 Jar包名称 描述 处理方案 spark-core_2.1.1-*.jar Spark任务的核心jar包。 Spark可以直接使用开源同版本的Spark包运行样例代码,但是不同版本的spark-core包在使用的时候可能导致互相序列化ID不一样,因此建议使用集群自带jar包。

    来自:帮助中心

    查看更多 →

  • Spark

    Spark Spark基本原理 Spark HA方案介绍 Spark与其他组件的关系 Spark开源增强特性 父主题: 组件介绍

    来自:帮助中心

    查看更多 →

  • Flink企业级能力增强

    Flink企业级能力增强 Flink SQL语法增强 多流Join场景支持配置表级别的TTL时间 配置Flink SQL Client支持SQL校验功能 Flink作业大小表Join能力增强 父主题: 使用Flink

    来自:帮助中心

    查看更多 →

  • HDFS企业级能力增强

    HDFS企业级能力增强 配置HDFS快速关闭文件功能 配置DataNode节点容量不一致时的副本放置策略 配置DataNode预留磁盘百分比 配置从NameNode支持读操作 配置NameNode黑名单功能 配置Hadoop数据传输加密 父主题: 使用HDFS

    来自:帮助中心

    查看更多 →

  • Hive企业级能力增强

    Hive企业级能力增强 配置Hive表不同分区分别存储至OBS和HDFS 配置Hive目录旧数据自动移除至回收站 配置Hive插入数据到不存在的目录中 配置创建Hive内部表时不能指定Location 配置用户在具有读和执行权限的目录中创建外表 配置基于HTTPS/HTTP协议的REST接口

    来自:帮助中心

    查看更多 →

  • Hive企业级能力增强

    Hive企业级能力增强 配置Hive目录旧数据自动移除至回收站 配置Hive插入数据到不存在的目录中 配置创建Hive内部表时不能指定Location 配置用户在具有读和执行权限的目录中创建外表 配置基于HTTPS/HTTP协议的REST接口 配置Hive Transform功能开关

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了