更新时间:2024-07-24 GMT+08:00
方案概述
应用场景
该解决方案基于开源软件Slurm构建,快速帮助用户在华为云云服务器上完成基因测序HPC环境的部署。Slurm是一个开源、容错和高度可扩展的集群管理和作业调度系统,适用于大型和小型Linux 集群。
方案架构
该解决方案部署架构如下图所示:
图1 方案架构图
该解决方案将会部署如下资源:
- 创建三台云服务器,自动部署HPC开源调度软件Slurm,提供基因测序HPC环境。
- 创建弹性服务共享文件,为基因测序HPC环境提供共享文件存储服务。
- 安全组可以保护云服务器的网络安全,通过配置安全组规则,限定云服务器的访问端口。
- 云服务器管理节点绑定弹性公网IP,用于用户访问基因测序HPC环境。
- 在调度节点安装Gearbox程序、配置java环境。
- 使用云监控服务,Gearbox程序监测集群作业状态,计算自定义指标workload值,上报指标到云监控服务。
方案优势
约束与限制
- 部署该解决方案之前,需注册华为账号并开通华为云,完成实名认证,且账号不能处于欠费或冻结状态。如果计费模式选择“包年包月”,请确保账户余额充足以便一键部署资源的时候可以自动支付;或者在一键部署的过程进入费用中心,找到“待支付订单”并手动完成支付。
- 请确保在部署解决方案前,使用的华为账号有IAM的足够权限,具体请参考3.1-创建rf_admin_trust委托。
- 确认租户配额充足:在“资源 > 我的配额”中查看以下配额是否充足,如配额不够,请提前提工单申请增加配额:
- 计算:云服务器实例数、CPU核心数、RAM容量;
- 存储:云硬盘、弹性文件服务;
- 网络:虚拟私有云、子网、弹性公网IP、安全组等。
- 目前仅华北-北京四区域支持华为云Flexus 云服务器X实例一键部署。