更新时间:2025-05-29 GMT+08:00
ModelArts中的作业为什么一直处于等待中?
当前训练任务排队的逻辑是先进先出,前面的任务没运行完后面的任务不会运行,有可能会造成小任务被“饿死”,需要用户注意。

饿死指的是前面的任务被一个大的任务堵着(例如是64卡),需要等空闲64卡这个任务才能运行,64卡的任务后面跟着1卡的。即使现在空出来30卡,这个1卡的任务也排不上。
- 如果是公共资源池,一般是由于其他用户占用资源导致。有以下方法可以尝试:
- 如果使用的是免费规格,可以换成收费规格,免费规格资源较少,排队概率高。
- 规格选择卡数尽量少,如可以选择1卡,相比于选择8卡排队几率大大降低。
- 可以尝试使用其他Region。
- 如果有长期的资源使用诉求,可以购买独占使用的专属资源池。
- 如果是专属资源池,建议您进行以下排查:
父主题: Standard专属资源池