文档首页/ AI开发平台ModelArts/ 常见问题/ Standard资源池/ 训练任务的排队逻辑是什么?
更新时间:2024-09-19 GMT+08:00
分享

训练任务的排队逻辑是什么?

当前训练任务排队的逻辑是先进先出,前面的任务没运行完后面的任务不会运行,有可能会造成小任务被“饿死”,需要用户注意。

饿死指的是前面的任务被一个大的任务堵着(例如是64卡),需要等空闲64卡这个任务才能运行,64卡的任务后面跟着1卡的。即使现在空出来30卡,这个1卡的任务也排不上。

相关文档