AI计算引擎Ray
AI计算引擎Ray是专为大规模AI工作负载设计的统一分布式计算引擎。Ray通过CPU、GPU、NPU异构计算调度,为AI工作负载提供统一的计算底座,覆盖从数据加载到预处理的全流程。
核心优势
- 多模态数据原生支持
不限于表格数据,原生支持图像、视频、音频、文本等非结构化数据的读取、转换与处理。
- 随需应变的弹性集群
Ray Cluster端点抽象管理分布式资源,同时提供按需手动调控算力规模的能力,实现成本与性能的精准平衡。
- 流式执行与零等待
采用流式处理模型,数据边计算边流动,避免 GPU/NPU等待全量数据加载,显著提升端到端吞吐量。
- 大幅降低生产级镜像的构建门槛
AI DataLake提供经过验证、开箱即用的基础Ray镜像,用户在此基础上进行自定义扩展。
核心功能
- 多格式数据源读取
通过ray.data.read_* 系列API直接读取Parquet、JSON、CSV、文本、图像、音频、视频等多种数据格式,支持从本地、云存储等后端获取数据。
- 在线扩缩容
基于Head-Worker架构组建Ray Cluster端点,通过更新端点实现在线增删Workergroups。
- Worker Autoscaling
支持Worker数量弹性范围配置,集群将根据当前任务队列长度和资源负载情况,在预置的最小值与最大值之间自动伸缩Worker数量。
- 细粒度资源调度
支持精确指定任务所需的CPU、GPU、NPU等资源,实现异构计算资源的精细化分配。
- 自定义Ray镜像管理
AI DataLake提供经过验证、开箱即用的基础Ray镜像,用户在此基础上进行自定义扩展,集成内部算法库、系统依赖包或特定版本的Python库,构建符合业务场景的个性化运行环境。
适用场景
- 大规模AI数据预处理。为训练模型进行海量数据的清洗、增强与特征工程。
- 端到端ML/RL流水线中的数据环节。在模型训练、超参调优的前端数据准备阶段,保障数据供给效率。