更新时间:2025-05-21 GMT+08:00

工作队列

工作队列是用户提交的作业(Job)在等待资源分配或正在运行时的集合。每个分区对应一个逻辑队列,可以设置独立的调度策略和资源限制。

分区

分区功能详情见分区管理

管理作业队列

  • 提交作业到指定分区,设置作业指定cpu和内存大小

  • 查看作业状态

作业板块

创建作业模板,可以设置作业使用cpu和内存

QoS

QoS用于限制用户/组的资源使用(如并发作业数、CPU/内存配额),并与分区绑定实现细粒度控制。

  1. 创建QoS
    sacctmgr add qoshigh_priority set MaxJobs=50 Priority=1000
    • MaxJobs:最大作业数
    • Priority:优先级(数值越大优先级越高)

  2. 将Qos绑定到分区

    仅允许作业使用分区中列出的 QoS。

作业功能

  • 作业依赖(Dependency)
    sbatch --dependency=afterok:<job_id> job2.sh  # 在job1成功后运行job2

  • 数组作业(Job Array)
    sbatch --array=0-4 job_array.sh  # 提交100个相似任务