更新时间:2025-12-17 GMT+08:00
分享

配置MPI软件运行环境

操作场景

本文介绍配置MPI软件运行环境的操作指导。

操作步骤

  1. 为ECS配置yum源。

    可以使用本地yum源。

  2. 执行以下命令,安装依赖包。

    yum install libuuid libuuid-devel autoconf automake libtool numactl-devel libnl3 python-devel libmnl-devel valgrind-devel rpm-build systemd-devel libdb-devel iptables-devel lsof libselinux-devel flex cmake elfutils-devel bison libnl3-devel numactl-devel libusbx tcl fuse-libs tcsh tk createrepo kernel-headers kernel-devel pciutils gcc-gfortran libXext rpcbind nfs-utils libXt gtk3 gcc gcc-c++ libnsl -y;

  3. 执行以下命令,设置nfs、rpcbind服务自启动。

    systemctl enable nfs

    systemctl enable rpcbind

  4. 执行以下命令,修改hostname。

    hostnamectl set-hostname [hostname]

    systemctl restart systemd-hostnamed

    /etc/hosts文件末尾增加配置,格式为:[ip] [hostname]

    ip必须指定是vRoCE设备的ip。

    图1 执行结果
  5. 设置节点间互信。
    1. 在主节点执行命令。

      ssh-keygen -t rsa

    2. 执行以下命令,生成authorized_keys。

      cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

    3. 执行以下命令,将id_rsa authorized_keys复制到其他所有节点。

      scp ~/.ssh/id_rsa ~/.ssh/authorized_keys xx:~/.ssh/

    4. 执行以下命令,通过ssh连接本端hostname和对端的hostname,确认可以免密ssh访问本端和对端。

      ssh [hostname]

    对于非ROOT用户,若存在权限问题,需注意如下几点:

    • 添加普通用户:useradd [test_name]
    • 普通用户密码:passwd [test_name]
    • 密码建议跟用户名字相同

    以test用户为例:

    • /home/test目录必须具有700权限
    • /home/test/.shh目录必须具有700权限
    • /home/test/.ssh/authorized_keys必须具有600权限
  6. 共享文件目录。
    1. 执行以下命令,在本端和对端创建相同的目录。

      mkdir /home/mpi

    2. 执行以下命令,添加/etc/exports文件,设置共享目录。

      /home/mpi/ *(rw,no_root_squash,no_all_squash,sync)

      echo "/home/mpi/ *(rw,no_root_squash,no_all_squash,sync)" > /etc/exports

    3. 执行以下命令,为对端挂载共享目录。

      mount -t nfs [源端vRoCE设备ip]:/home/mpi/ /home/mpi/ -o nolock,nfsvers=3,vers=3

  1. 执行以下命令,编辑hosts文件。

    vim /home/mpi/hosts

    文件中增加本端和对端的hostname。

    图2 执行结果

相关文档