文档首页 > > 用户指南> 插件管理> gpu-beta

gpu-beta

分享
更新时间:2020/11/28 GMT+08:00

插件简介

gpu-beta插件是支持在容器中使用GPU显卡的设备管理插件,仅支持Nvidia驱动。

约束与限制

  • 安装gpu-beta插件的集群中必须包含GPU节点。
  • 下载的驱动必须是后缀为“.run”的文件。
  • 若下载链接为公网地址,如Nvidia官网,各GPU节点均需要绑定EIP。
  • 若下载链接为OBS上的链接,无需绑定EIP 。
  • 已验证支持的Nvidia驱动最新版本为396.37,不建议安装更高版本的驱动。
  • 更改驱动版本后,需要重启节点才能生效。

安装插件

  1. 登录CCE控制台,在左侧导航栏中选择“插件管理”。在“插件市场”页签下,单击gpu-beta插件下的“安装插件”。
  2. 在安装插件页面,选择安装的集群和插件版本,单击“下一步:规格配置”。
  3. 插件版本为1.1.6以及之前时:

    在规格配置页面,有两种配置驱动地址的方式可供选择:
    图1 安装Nvidia驱动

    卸载GPU-BETA插件不会卸载驱动。若重新安装了驱动,需重启所有GPU节点。

    1. “已验证驱动地址”页签下,选择华为云已经验证过的Nvidia驱动。
    2. “自定义驱动地址”页签下,输入您获取的Nvidia驱动链接。如何获取驱动链接,请参考获取驱动链接方式

      例如,nvidia396.37版本驱动链接:https://us.download.nvidia.com/tesla/396.37/NVIDIA-Linux-x86_64-396.37.run

    插件版本为1.1.10时:

    在规格配置页面,配置驱动链接地址。如何获取驱动链接,请参考获取驱动链接方式

    • 如果下载链接为公网地址,如nvidia官网地址'https://us.download.nvidia.com/tesla/396.37/NVIDIA-Linux-x86_64-396.37.run',各GPU节点均需要绑定EIP。
    • 如果下载链接为OBS上的链接,无需绑定EIP。

  4. 单击“安装”,安装gpu-beta插件的任务即可提交成功。

    待插件安装完成后,单击“返回插件管理”,在“插件实例”页签下,选择对应的集群,可查看到运行中的实例,这表明该插件已在当前集群中各GPU节点上安装。

获取驱动链接方式

  1. 登录到 https://www.nvidia.cn/Download/Find.aspx?lang=cn 网站。
  2. 图2所示,在“NVIDIA 驱动程序下载”框内选择对应的驱动信息。其中“操作系统”必须选Linux 64-bit

    图2 参数选择

  3. 驱动信息确认完毕,单击“搜索”按钮,会跳转到驱动信息展示页面,该页面会显示驱动的版本信息如图3,单击“下载”到下载页面。

    图3 驱动信息

  4. 获取驱动软件链接方式分两种:

卸载插件

  1. 登录CCE控制台,在左侧导航栏中选择“插件管理”。在“插件实例”页签下,选择对应的集群,单击“gpu-beta”下的“卸载”
  2. 在弹出的窗口中,单击“是”,可卸载该插件。

    卸载gpu-beta插件不会卸载驱动。若重新安装了驱动,需重启所有GPU节点。

分享:

    相关文档

    相关产品

文档是否有解决您的问题?

提交成功!非常感谢您的反馈,我们会继续努力做到更好!
反馈提交失败,请稍后再试!

*必选

请至少选择或填写一项反馈信息

字符长度不能超过200

提交反馈 取消

如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨

智能客服提问云社区提问