更新时间:2026-04-14 GMT+08:00
分享

故障恢复

  • 工作空间级故障恢复

    AI DataLake系统采用存算分离的架构,计算集群基于Kubernetes资源调度和故障切换机制,在系统故障时,支持自动故障恢复。

  • 作业级故障恢复

    AI DataLake作业支持配置自动重启恢复机制,在开启自动重启功能后,当作业出现异常时将自动重启恢复作业。

    表1

    引擎

    说明

    Aura

    Aura不提供作业级故障恢复。

    Ray

    Ray不提供作业级故障恢复。

    Spark

    支持Task级故障恢复。

    Flink

    支持Task级故障恢复。

相关文档