Ray引擎端点概述
端点类型
在工作空间中提交作业时,是通过端点来连接引擎与计算资源。创建端点时,AI DataLake自动将引擎和计算资源池绑定,在后续提交作业时无需再手动配置作业与引擎和资源的映射关系。
端点分为端点引擎类型和端点类型,两个维度互相结合,满足不同业务场景的需求。
- 端点引擎类型是指端点绑定的计算引擎,决定了数据处理的计算方式和能力。
- 端点类型是指端点的使用模式,决定了连接方式、资源使用模式和适用场景。 图1 端点类型介绍
Ray引擎支持配置的端点类型
Ray引擎支持配置RayCluster端点:
RayCluster端点提供长期运行、可复用的“计算资源池”,可多次提交Ray作业,适用于需要反复交互、多任务共享常驻环境的场景。
Ray引擎支持的资源使用模式
Ray引擎支持预留资源模式,该模式通过预留资源,实现性能独享和成本优化,确保业务基线稳定,适用于负载稳定业务场景。
资源使用模式:预留资源
- 模式介绍
预留资源通过预留专属计算资源,确保业务所需的计算资源的稳定性,同时获得最优的单价成本。
在预留资源模式下,用户预先购买一定量的计算资源,这些资源始终为用户保留独享。无论是否使用这些资源,都需要按预留的资源数量支付费用。这种模式适合负载稳定、持续运行的业务场景,能够提供稳定的性能保障和最优的成本效率。
图2 预留资源模式示意图
- 核心特性
资源独享,性能稳定:预留资源完全独享,不存在资源争抢问题,性能更加稳定。
- 适用场景
- 负载长期稳定运行的业务:资源使用量稳定,例如持续运行的服务,日均处理量波动较小的业务。
- 性能保障要求高的业务:对查询延迟有严格要求,需要稳定的资源保障响应性能的应用。独享资源可以确保性能不会受到其他用户的影响。
- 成本优化场景的业务需求:长期运行的生产环境的业务,在资源利用率不变的情况下可以通过使用预留资源池降低资源成本。