ib配置 更多内容
  • 安装IB驱动(可选)

    Linux 7.4。 IB驱动安装版本:官网有4.2版本驱动时,建议安装4.2版本;如果没有4.2版本驱动,建议安装4.3或更新版本。 前提条件 已登录虚拟机。 IB驱动安装包(下载对应操作系统的)已上传到虚拟机。 操作步骤 参考软件准备章节下载OFED。 根据虚拟机的操作系统选择相应

    来自:帮助中心

    查看更多 →

  • 怎样给IB网卡手动配置IP地址?

    怎样给IB网卡手动配置IP地址? IPoIB(IP over IB)是在InfiniBand协议上提供IP协议进行数据传输的能力。对于使用SUSE操作系统的H2型、HL1型 云服务器 ,如需使用IPoIB功能,需要在安装IB网卡驱动之后,给IB网卡手动配置一个IP地址。 前提条件

    来自:帮助中心

    查看更多 →

  • IB驱动自带的OpenMPI

    IB驱动自带的OpenMPI 操作场景 本节指导用户安装和使用IB驱动自带的OpenMPI(以版本3.0.0rc6为例)。 前提条件 已配置 弹性云服务器 免密登录。 操作步骤 检查是否已安装IB驱动。 使用“PuTTY”,采用密钥对方式登录弹性云 服务器 。 执行以下命令,切换为root

    来自:帮助中心

    查看更多 →

  • IB驱动自带的OpenMPI

    IB驱动自带的OpenMPI 操作场景 该任务指导用户在BMS集群上运行IB驱动自带的MPI应用(3.1.0rc2版本)。 前提条件 已配置BMS集群间互相免密登录。 集群中所有的BMS,均已安装IB驱动自带的OpenMPI。 操作步骤 关闭防火墙。 登录集群中任意一台BMS。 执行以下命令,关闭BMS防火墙。

    来自:帮助中心

    查看更多 →

  • 安装和使用IB驱动自带的Open MPI

    执行以下命令,查询是否已成功安装IB驱动。 $ ls /usr/mpi/gcc/openmpi-3.1.0rc2/bin/mpirun $ rpm -qa | grep mlnx-ofa 图1 确认已安装IB驱动 查看回显结果。 如果回显如图1所示,表示已安装IB驱动,执行3。 如果未安装IB驱动,执行2。

    来自:帮助中心

    查看更多 →

  • CCI是否支持高速IB(Infiniband)网络?

    CCI是否支持高速IB(Infiniband)网络? 不支持。 父主题: 网络管理类

    来自:帮助中心

    查看更多 →

  • IPoIB功能简介

    址自动化发放和配置。 IPoIB的约束和限制 支持管理一个IB网卡。 继承BMS、H2型、HL1型、HI3型云服务器对IB网卡的使用约束与限制,使用IPoIB特性的弹性云服务器不支持迁移。 继承H2型、HL1型、HI3型云服务器对IB网卡的使用约束与限制,使用的IB网络不支持安全组、Qos、三层及以上网络功能。

    来自:帮助中心

    查看更多 →

  • 安装和使用IB驱动自带的Open MPI

    安装和使用IB驱动自带的Open MPI 操作场景 该任务指导用户在鲲鹏BMS集群上运行IB驱动自带的MPI应用(以版本4.0.2a1为例)。 前提条件 已配置BMS集群间互相免密登录。 集群中所有的BMS,均已安装IB驱动自带的OpenMPI。 操作步骤 关闭防火墙。 登录集群中任意一台BMS。

    来自:帮助中心

    查看更多 →

  • 安装和使用IB驱动自带的Open MPI

    安装和使用IB驱动自带的Open MPI 操作场景 本节操作指导用户在BMS上安装和使用IB驱动自带的Open MPI(以版本4.0.2a1为例)。 对于集群中的每台BMS,都需要执行该操作。 前提条件 已配置BMS集群间互相免密登录。 操作步骤 查询是否安装IB驱动 执行以下命令,查询是否已成功安装IB驱动。

    来自:帮助中心

    查看更多 →

  • 重建裸金属服务器

    业务强依赖IP地址,则需要使用静态配置方法重新配置IB网络的IP,参考以下方法将IB网卡的IP地址配置为重建前的IP地址。 登录 裸金属服务器 操作系统。 新建配置文件“/etc/sysconfig/network-scripts/ifcfg-ib0”,此处以CentOS操作系统为例

    来自:帮助中心

    查看更多 →

  • 在ModelArts创建分布式训练时如何设置NCCL环境变量?

    NCCL_IB_TIMEOUT 18 用于控制IB通信超时时间,算法为“4.096 µs * 2 ^ timeout”。如出现NCCL通信超时问题可适当调大,最大可调整至22。较大的值可能会影响性能,设置为18相对平衡。 NCCL_IB_RETRY_CNT 15 IB通信重试次数

    来自:帮助中心

    查看更多 →

  • 怎样检查IB云服务器的网络是否正常?

    怎样检查IB云服务器的网络是否正常? 对于已安装InfiniBand网卡驱动的H2型弹性云服务器(以下简称IB云服务器),可以通过如下方式,检查云服务器的IB网卡驱动安装成功、网络连通,可以正常工作。 检查过程中,如果发现您的弹性云服务器未安装ibstat等命令工具,需先从Inf

    来自:帮助中心

    查看更多 →

  • 在HPC集群上运行Intel MPI

    依次登录集群中所有E CS ,重复执行2.d~2.f。 配置IB网卡的IP地址。 对集群中所有的ECS,执行以下命令,为IB驱动配置IP地址。 # ifconfig ib0 192.168.23.34/24 # ifconfig ib0 192.168.23.35/24 ... IP地址可随意指定,但需要在同一网段内。

    来自:帮助中心

    查看更多 →

  • 安装和使用MPICH

    安装和使用MPICH 操作场景 该任务指导用户在BMS集群上运行MPICH应用(mpich-3.3.2版本)。 前提条件 已配置BMS集群间互相免密登录。 集群中所有的BMS,均已安装MPICH。 操作步骤 关闭防火墙。 登录集群中任意一台BMS。 执行以下命令,关闭BMS防火墙。

    来自:帮助中心

    查看更多 →

  • 在HPC集群上运行Platform MPI

    依次登录集群中所有ECS,重复执行步骤2.4~步骤2.6。 配置IB网卡的IP地址。 对集群中所有的ECS,执行以下命令,为IB驱动配置IP地址。 # ifconfig ib0 192.168.23.34/24 # ifconfig ib0 192.168.23.35/24 ... IP地址可随意指定,但需要在同一网段内。

    来自:帮助中心

    查看更多 →

  • 安装和使用社区OpenMPI

    安装和使用社区OpenMPI 操作场景 该任务指导用户在BMS集群上运行社区OpenMPI(以4.0.2版本为例))。 前提条件 已配置BMS集群间互相免密登录。 集群中所有的BMS,均已安装社区OpenMPI。 操作步骤 关闭防火墙。 登录集群中任意一台BMS。 执行以下命令,关闭BMS防火墙。

    来自:帮助中心

    查看更多 →

  • 修订记录

    2017-12-15 第三次正式发布。 修改 创建支持IB网卡的弹性云服务器 2017-09-30 第二次正式发布。 增加 IPoIB功能简介 Intel MPI 在HPC集群上运行Intel MPI 配置ECS集群互相免密登录 修改 配置单个ECS免密登录 2017-07-11 第一次正式发布。

    来自:帮助中心

    查看更多 →

  • GPU A系列裸金属服务器如何进行RoCE性能带宽测试?

    A系列裸金属服务器上测试RoCE性能带宽。 前提条件 GPU A系列裸金属服务器已经安装IB驱动。(网卡设备名称可以使用ibstatus或者ibstat获取。华为云Ant8裸金属服务器使用Ubuntu20.04操作系统默认已经安装IB驱动。) 操作步骤 方法1:使用mlx硬件计数器,估算ROCE网卡收发流量

    来自:帮助中心

    查看更多 →

  • 弹性云服务器场景典型应用

    弹性云服务器场景典型应用 创建支持IB网卡的弹性云服务器 配置单个ECS免密登录 安装和使用MPI 制作私有镜像 创建应用集群 配置ECS集群互相免密登录 在HPC集群上运行MPI应用

    来自:帮助中心

    查看更多 →

  • 日志提示“no socket interface found”

    internal error 原因分析 可能原因如下: 原因1:未设置环境变量NCCL_IB_TC、NCCL_IB_GID_INDEX、NCCL_IB_TIMEOUT,因此会导致通信速度慢且不稳定,最后造成IB通信断连,偶发上述现象。 原因2:NCCL_SOCKET_IFNAME设置错误。当用户的NCCL版本低于2

    来自:帮助中心

    查看更多 →

  • 在HPC集群上运行IB驱动自带的OpenMPI

    在HPC集群上运行IB驱动自带的OpenMPI 操作场景 该任务指导用户在已配置好的弹性云服务器上,运行IB驱动自带的MPI应用(3.0.0rc6版本)。 前提条件 已成功创建带IB网卡的弹性云服务器,并绑定了弹性IP进行登录。 已使用私有镜像创建多个弹性云服务器。 操作步骤 使

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了