更新时间:2026-04-30 GMT+08:00
分享

Ray引擎端点概述

端点类型

在工作空间中提交作业时,是通过端点来连接引擎与计算资源。创建端点时,AI DataLake自动将引擎和计算资源池绑定,在后续提交作业时无需再手动配置作业与引擎和资源的映射关系。

端点分为端点引擎类型和端点类型,两个维度互相结合,满足不同业务场景的需求。

  • 端点引擎类型是指端点绑定的计算引擎,决定了数据处理的计算方式和能力。
  • 端点类型是指端点的使用模式,决定了连接方式、资源使用模式和适用场景。
    图1 端点类型介绍

Ray引擎支持配置的端点类型

Ray引擎支持配置RayCluster端点:

RayCluster端点提供长期运行、可复用的“计算资源池”,可多次提交Ray作业,适用于需要反复交互、多任务共享常驻环境的场景。

Ray引擎支持的资源使用模式

Ray引擎支持预留资源模式,该模式通过预留资源,实现性能独享和成本优化,确保业务基线稳定,适用于负载稳定业务场景。

资源使用模式:预留资源

  • 模式介绍

    预留资源通过预留专属计算资源,确保业务所需的计算资源的稳定性,同时获得最优的单价成本。

    在预留资源模式下,用户预先购买一定量的计算资源,这些资源始终为用户保留独享。无论是否使用这些资源,都需要按预留的资源数量支付费用。这种模式适合负载稳定、持续运行的业务场景,能够提供稳定的性能保障和最优的成本效率。

    图2 预留资源模式示意图
  • 核心特性

    资源独享,性能稳定:预留资源完全独享,不存在资源争抢问题,性能更加稳定。

  • 适用场景
    • 负载长期稳定运行的业务:资源使用量稳定,例如持续运行的服务,日均处理量波动较小的业务。
    • 性能保障要求高的业务:对查询延迟有严格要求,需要稳定的资源保障响应性能的应用。独享资源可以确保性能不会受到其他用户的影响。
    • 成本优化场景的业务需求:长期运行的生产环境的业务,在资源利用率不变的情况下可以通过使用预留资源池降低资源成本。

相关文档