更新时间:2025-05-21 GMT+08:00

快速入门

  1. 登录

    访问驾舱 master 节点绑定的 EIP,会跳转到登录界面,使用 admin/admin 登录

  2. 创建分区

    进入分区管理页面,单击“集群管理 > 分区管理”。

    参数配置说明如下表所示。

    参数

    说明

    规格

    计算节点的 flavor,比如 c6s.xlarge.2

    镜像

    计算节点私有镜像的 id

    AZ

    计算节点所在可用区,比如 cn-southwest-2a

    VPC ID

    计算节点所在网络 id,建议和master保持一致

    子网ID

    计算节点所在子网 id,建议和master保持一致

    安全组

    计算节点所在安全组的 id,建议和master保持一致

    SFS 挂载地址

    sfs-turbo 挂载地址,比如 sfs-turbo 共享路径是 xxx.sfsturbo.internal:/,

    需要将 xxx.sfsturbo.internal:/ 挂载到/mnt/sfs_turbo_1,

    并将 xxx.sfsturbo.internal:/home 挂载到 /home

  3. 创建计算集群

    进入资源管理页面,单击“增加计算节点”。

    参数配置说明如下表所示。

    参数

    说明

    计费模式

    计算节点的计费模式,支持包年/包月和按需计费

    分区

    节点所在分区

    规格

    计算节点的规格

    数量

    创建的计算节点数量

    可用区

    计算节点所在可用区,非必填,未填会取分区上的设置

    节点前缀

    计算节点前缀,非必填,未填会取分区上的设置

    镜像ID

    计算节点使用的镜像,非必填,未填会取分区上的设置

  4. 创建模板

    进入模板管理页面,单击“系统管理 > 作业模板管理”。

  5. 提交任务

    业务管理页面,可以提交作业。

    参数配置说明如下表所示。

    参数

    说明

    作业模板

    下拉选择作业模板

    执行用户

    任务的执行用户,默认以当前用户执行

    环境变量

    定义需要传给 slurm 的环境变量

    作业命令

    任务脚本

    分区

    任务提交的分区

    Feature

    可以给计算节点打 feature, 提交任务时,可以根据 feature 调度

    执行路径

    脚本执行的路径,需要定义为挂载的公共路径

    标准输出

    作业输出的日志文件名称,非必填

    错误输出

    作业异常日志文件,非必填

    节点数

    作业需要的节点数

    单节点任务数

    每个节点运行的任务数

    单节点vcpu数

    每个节点的vcpu数

    单节点内存

    任务需要的单节点内存大小

    作业提交后,可以实时查看作业日志。

    作业完成后可以查看作业列表,作业统计信息以及作业资源使用情况。