文档首页/ 高性能计算 HPC/ HPC-S²用户指南/ 快速入门/ 方法二:使用已有节点部署HPC集群
更新时间:2024-05-17 GMT+08:00

方法二:使用已有节点部署HPC集群

操作场景

如果用户需要使用已有的ECS节点资源构建HPC集群,可以使用该功能进行集群的部署。下面介绍如何使用已有节点部署HPC集群。

使用已有节点部署集群,首先选择管理节点,再选择计算节点,切换计算节点与管理节点需要有相同的CPU架构,需要在相同的虚拟私有云、安全组,且使用同一个镜像主版本。

购买须知

  • 第一次使用公有云服务时,系统将自动为您创建一个虚拟私有云,包括安全组、网卡。同时,用户可根据需要自行创建一个虚拟私有云,更多关于虚拟私有云的信息,请参见《虚拟私有云用户指南》
  • 用户可使用系统自动创建的安全组,也可以根据需要自行创建一个安全组使用,安全组规则的配置会影响弹性云服务器的正常访问与使用。

    为确保集群能正常创建/部署,需保证安全组规则22端口开放,具体配置方法请参见:为安全组添加安全组规则

  • 一站式HPC服务使用弹性文件服务SFS作为文件共享存储,更多关于弹性文件系统的信息,请参见《弹性文件服务用户指南》

操作步骤

  1. 登录HPC-S²控制台。
  2. 单击管理控制台左上角的,选择区域和项目。
  3. 单击“部署HPC集群”。

    系统进入部署HPC集群页面。

  4. 选择“区域”。

    不同区域的云服务产品之间内网互不相通。请就近选择靠近您业务的区域,可减少网络时延,提高访问速度。

  5. 设置集群名称。

    名称可自定义,但需符合命名规则。集群名称命名规则如表1所示。

    表1 集群名称命名规则

    参数

    规则

    样例

    集群名称

    • 集群名称长度范围为1到52位。
    • 只能由英文字母、数字、“-”以及“.”组成
    • 名称不能以“-”、“.”开头和结尾
    • 不能包含连续的“-”和“.”,例如“--”、“..”、“-.”和“.-”

    hpc-001.p1

  6. 选择“管理节点”

    管理节点的筛选需要满足以下条件:

    • 当前指定区域的ECS节点;
    • 该节点状态为“运行中”。
    • 该节点绑定了弹性IP。
    • 该节点不在当前账号下的其他集群中。
  7. 选择“安全组”

    安全组为选定的管理节点所使用的安全组策略,如果有多个策略,可根据需要选择。

  8. 选择“计算节点”

    计算节点的筛选需要满足以下条件:

    • 当前指定区域的ECS节点。
    • 计算节点状态为“运行中”。
    • 计算节点与管理节点为相同的CPU架构。
    • 计算节点与所选管理节点有相同的VPC、安全组。
    • 计算节点与管理节点使用的是同一镜像主版本。
    • 所选的计算节点数不超过50个。
  9. 选择“虚拟私有云”

    虚拟私有云为选定的管理节点所在的VPC,无需选择。

  10. 设置“登录方式”。

    已有节点部署集群,当前只支持密码方式,如果您使用“密钥”方式创建的云服务器,请手动设置登录密码,另外,使用密码方式时请增强密码的复杂度,保证密码符合要求,防止恶意攻击。

    Linux操作系统时为root用户的初始密码,Windows操作系统时为Administrator用户的初始密码。密码复杂度需满足表2要求。

    表2 密码规则

    参数

    规则

    样例

    密码

    • 密码长度范围为8到26位。
    • 密码至少包含以下4种字符中的3种:
      • 大写字母
      • 小写字母
      • 数字
      • 特殊字符,包括“$”“!”“@”“%”“-”“_”“=”“+”“[”“]”“:”“.”“/”“^”“,”“{”“}”“?”
    • 密码不能包含用户名或用户名的逆序。
    • Windows系统的弹性云服务器,不能包含用户名中超过两个连续字符的部分。

    YNbUwp!dUc9MClnv

    说明:

    样例密码随机生成,请勿复制使用样例。

  11. 选择 “弹性文件服务”。

    弹性文件服务自动根据“网络配置”当中所选VPC筛选,如不存在弹性文件系统,需手动创建,并添加对应VPC的权限。具体请参考“创建文件系统

  12. 选择“调度器”。

    当前只支持slurm和sge两种调度器,系统默认调度器为slurm,请根据所需自行选择。

  13. 核对当前配置,确认无误后单击“部署HPC集群”,提交创建。
  14. 提交成功后,返回到集群管理页面,可查看到集群列表中该集群已经是“部署中”了,等待集群创建完成变成“运行中”代表集群部署完成。

后续操作

如需查看集群详情、节点列表、共享存储信息,请参考查看HPC集群