更新时间:2026-05-26 GMT+08:00
分享

AI计算引擎Ray

AI计算引擎Ray是专为大规模AI工作负载设计的统一分布式计算引擎。Ray通过CPU、GPU、NPU异构计算调度,为AI工作负载提供统一的计算底座,覆盖从数据加载到预处理的全流程。

核心优势

  • 多模态数据原生支持

    不限于表格数据,原生支持图像、视频、音频、文本等非结构化数据的读取、转换与处理。

  • 随需应变的弹性集群

    Ray Cluster端点抽象管理分布式资源,同时提供按需手动调控算力规模的能力,实现成本与性能的精准平衡。

  • 流式执行与零等待

    采用流式处理模型,数据边计算边流动,避免 GPU/NPU等待全量数据加载,显著提升端到端吞吐量。

  • 大幅降低生产级镜像的构建门槛

    AI DataLake提供经过验证、开箱即用的基础Ray镜像,用户在此基础上进行自定义扩展。

核心功能

  • 多格式数据源读取

    通过ray.data.read_* 系列API直接读取Parquet、JSON、CSV、文本、图像、音频、视频等多种数据格式,支持从本地、云存储等后端获取数据。

  • 在线扩缩容

    基于Head-Worker架构组建Ray Cluster端点,通过更新端点实现在线增删Workergroups。

  • Worker Autoscaling

    支持Worker数量弹性范围配置,集群将根据当前任务队列长度和资源负载情况,在预置的最小值与最大值之间自动伸缩Worker数量。

  • 细粒度资源调度

    支持精确指定任务所需的CPU、GPU、NPU等资源,实现异构计算资源的精细化分配。

  • 自定义Ray镜像管理

    AI DataLake提供经过验证、开箱即用的基础Ray镜像,用户在此基础上进行自定义扩展,集成内部算法库、系统依赖包或特定版本的Python库,构建符合业务场景的个性化运行环境。

适用场景

  • 大规模AI数据预处理。为训练模型进行海量数据的清洗、增强与特征工程。
  • 端到端ML/RL流水线中的数据环节。在模型训练、超参调优的前端数据准备阶段,保障数据供给效率。

相关文档