AI计算引擎Ray

AI计算引擎Ray是专为大规模AI工作负载设计的统一分布式计算引擎。Ray通过CPU、GPU、NPU异构计算调度，为AI工作负载提供统一的计算底座，覆盖从数据加载到预处理的全流程。

多模态数据原生支持
不限于表格数据，原生支持图像、视频、音频、文本等非结构化数据的读取、转换与处理。
随需应变的弹性集群
依托物理多租户架构，通过端点管理分布式资源，支持预留/混合/按需资源模式，持续优化资源水位与单位算力成本，实现成本与性能的精准平衡。
流式执行与零等待
采用流式处理模型，数据边计算边流动，避免 GPU/NPU等待全量数据加载，显著提升端到端吞吐量。
大幅降低生产级镜像的构建门槛
AI DataLake提供经过验证、开箱即用的基础Ray镜像，用户在此基础上进行自定义扩展。

多格式数据源读取
通过ray.data.read_* 系列API直接读取Parquet、JSON、CSV、文本、图像、音频、视频等多种数据格式，支持从本地、云存储等后端获取数据。
三种模式，随“算”而动
提供预留资源保障长稳作业、混合模式兼顾效率与突发、按需弹性实现秒级扩容，适配多样化Ray工作负载。
任务驱动的Ray集群弹性扩缩容
基于Head-Worker架构，支持配置弹性边界，系统依据任务队列长度与资源负载动态在线调整Worker Group规模，实现作业吞吐与计算资源的自适应匹配。
细粒度资源调度
支持精确指定任务所需的CPU、GPU、NPU等资源，实现异构计算资源的精细化分配。
自定义Ray镜像管理
AI DataLake提供经过验证、开箱即用的基础Ray镜像，用户在此基础上进行自定义扩展，集成内部算法库、系统依赖包或特定版本的Python库，构建符合业务场景的个性化运行环境。