文档首页/ 数据湖探索 DLI/ 产品介绍/ 计算资源类型和产品规格
更新时间:2025-09-08 GMT+08:00

计算资源类型和产品规格

DLI的计算资源是执行作业的基础,DLI的弹性资源池和队列都属于计算资源,本节内容介绍DLI计算资源的类型和产品规格。

视频简介

视频介绍DLI计算资源类型。

什么是弹性资源池和队列?

在了解DLI计算资源模式前首先了解弹性资源池和队列的基本概念。

  • 弹性资源池

    弹性资源池是DLI计算资源的一种池化管理模式,可以看作DLI计算资源的集合。DLI支持在弹性资源池中创建多个队列,且这些队列可以共享弹性资源池中的资源。

    了解弹性资源池的产品规格请参考弹性资源池产品规格

    图1是弹性资源池的架构图。了解更多弹性资源池的优势请参考DLI弹性资源池和队列简介

    • 弹性资源池的物理资源层由分布在不同可用区的计算节点组成。
    • 同一资源池内的多个队列共享物理资源,但通过逻辑隔离保障资源分配策略(如优先级、配额)。
    • 弹性资源池可以根据队列负载实时调整资源,实现分钟级按需弹性伸缩。
    • 弹性资源池能够同时支持SQL作业、Spark作业、Flink作业,具体支持的作业类型取决于在弹性资源池中创建的队列类型。
      了解DLI计算资源模式与支持的队列类型
      图1 弹性资源池架构图
  • 队列

    队列是DLI中被实际使用和分配的基本单元,即队列是执行作业所需的具体的计算资源。您可以为不同的作业或数据处理任务创建不同的队列,并按需对这些队列分配和调整资源。

    DLI分为三种队列类型: default队列、SQL队列、通用队列,您可以根据业务场景和作业特性选择最合适的队列类型。

    • default队列:

      DLI服务预置的队列,所有用户共享。

      不支持指定default队列资源大小,资源在执行作业时按需分配,并按实际扫描的数据量计费。

      由于default队列是共享资源,在使用时可能会出现资源抢占的情况,不能保证每次都能获得资源来执行作业。

      default队列适用小规模或临时的数据处理需求。对于重要的或需要保证资源的作业,建议购买弹性资源池并在弹性资源池中创建队列来执行作业。

    • SQL队列:

      SQL队列是用于执行SQL作业的队列,支持指定引擎类型包括Spark和HetuEngine。

      SQL队列适用于需要快速数据查询和分析,以及需要定期清理缓存或重置环境的业务。

    • 通用队列:

      通用队列用于执行Spark作业、Flink OpenSource SQL作业和Flink Jar作业的队列。

      适合适用于复杂数据处理、实时数据流处理或批量数据处理的场景。

DLI计算资源模式

DLI提供了三种计算资源的管理模式,每一种模式都有独特的优势和适用场景。

图2 DLI计算资源模式
  • 弹性资源池模式:
    计算资源的池化管理模式,提供计算资源的动态扩缩容能力,同一弹性资源池中的队列共享计算资源。通过合理设置队列的计算资源分配策略,可以提高计算资源利用率,应对业务高峰期的资源需求。
    • 适用场景:适合业务量有明显波动的场合,如周期性的数据批处理任务或实时数据处理需求。
    • 支持的队列类型:SQL队列(Spark)、SQL队列(HetuEngine)、通用队列。了解DLI的队列类型请参考队列类型

      弹性资源池模式的通用队列和SQL队列不支持跨可用区。

    • 使用方法:先创建弹性资源池,然后在弹性资源池中创建队列并分配计算资源,队列关联到具体的作业和数据处理任务。

      购买弹性资源池并在弹性资源池中添加队列的具体操作步骤请参考创建弹性资源池并添加队列

  • 全局共享模式:

    全局共享模式是一种根据SQL查询中实际扫描的数据量来分配计算资源的模式,不支持指定或预留计算资源。

    DLI服务预置的“default”队列即为全局共享模式的计算资源,资源的大小是按需分配的。在不确定数据量大小或偶尔需要进行数据处理的用户,可以使用default队列执行作业。

    • 适用场景:适用于测试作业或资源消耗不高的情况。
    • 支持的队列类型:仅DLI预置的default队列为全局共享模式的计算资源。

      “default”队列只用于用户体验DLI,是所有人共享的公共资源,使用时可能会出现用户间抢占资源的情况,不能保证每次都可以得到资源执行相关操作。建议使用自建队列执行生产作业。

    • 使用方法:default队列仅适用于提交SQL作业,在DLI管理控制台提交SQL作业时选择"default队列"即可。
  • 非弹性资源池模式(废弃,不推荐使用)

    DLI的上一代计算资源管理方式,因缺乏灵活性,目前已不推荐使用。

    非弹性资源池模式提供固定规格的计算资源,购买后独占资源,无法根据需求动态调整,可能会导致资源浪费或在需求高峰期资源不足。

为了方便您理解DLI不同计算资源模式的适用场景,我们把购买DLI计算资源比作用车服务:

  • 弹性资源池模式可以比作“租车”,您可以根据实际需求动态调整资源的规模。

    这种模式适合于业务需求波动较大的场景,灵活地根据业务峰谷来调整资源,优化成本。

  • 全局共享模式可以比作“打车”,您只需为实际使用的数据量付费。

    这种模式适合于不确定数据量大小或仅需要偶尔进行数据处理的场景,按需使用资源,无需预先购买或预留资源。

DLI计算资源模式与支持的队列类型

表1介绍DLI不同计算资源模式支持的队列类型。

表1 DLI计算资源模式与支持的队列类型

DLI计算资源模式

支持的队列类型

资源特点

适用场景

弹性资源池模式

SQL队列(Spark)

SQL队列(HetuEngine)

通用队列

单用户多队列共享资源

资源动态分配,灵活调整

适合业务需求波动较大,需要灵活调整资源以应对波峰波谷的业务场景。

全局共享模式

default队列

多用户多队列共享资源

按量付费,不支持预留资源

适合不确定数据量大小或仅需要偶尔进行数据处理的临时或测试项目场景。

非弹性资源池模式

(废弃,不推荐使用)

SQL队列

通用队列

单用户单队列独享资源

无法动态调整,资源可能会闲置

废弃,不推荐使用

弹性资源池产品规格

弹性资源池为DLI作业运行提供所需的计算资源(CPU和内存)。弹性资源池的单位为CU,1CU包含1CPU和4GB内存。

您可以在弹性资源池中创建多个队列, 队列之间的计算资源支持共享。 通过合理设置队列的计算资源池分配策略,提高计算资源利用率。

DLI弹性资源池之间为物理集群隔离,同一个弹性资源池中的队列之间为逻辑隔离。

建议您对测试业务场景和生产业务场景分别创建弹性资源池,通过资源物理隔离的方式,保障资源管理的独立性和安全性。

DLI提供的弹性资源池规格如表2所示。

表2 弹性资源池规格

类型

规格

约束限制

适用场景

基础版

16-64CUs规格

  • 不支持高可靠与高可用。
  • 不支持设置队列属性。
  • 不支持作业优先级。
  • 不支持对接Notebook实例。

其他弹性资源池使用相关约束限制请参考弹性资源池使用约束限制

适用于对资源消耗不高、对资源高可靠性和高可用性要求不高的测试场景。

标准版

64CUs及以上规格

其他弹性资源池使用相关约束限制请参考弹性资源池使用约束限制

具备强大的计算能力、高可用性、及灵活地资源管理能力,适用于大规模计算任务场景和有长期资源规划需求的业务场景。