更新时间:2024-12-02 GMT+08:00
分享

GPU调度概述

工作负载支持使用节点GPU资源,GPU资源使用可以分为如下两种模式:

  • GPU静态分配(共享/独享):按比例给Pod分配GPU显卡资源,支持独享(分配单张/多张显卡)和共享(部分显卡)方式。
  • GPU虚拟化:UCS On Premises GPU采用xGPU虚拟化技术,能够动态对GPU设备显存与算力进行划分,单个GPU卡最多虚拟化成20个GPU虚拟设备。相对于静态分配来说,虚拟化的方案更加灵活,最大程度保证业务稳定的前提下,可以完全由用户定义使用的GPU数量,提高GPU利用率。

    GPU虚拟化功能优势如下:

    • 灵活:精细配置GPU算力占比及显存大小,算力分配粒度为5%GPU,显存分配粒度达MB级别。
    • 隔离:支持显存和算力的严格隔离,支持单显存隔离,算力与显存同时隔离两类场景。
    • 兼容:业务无需重新编译,无需进行CUDA库替换,对业务无感。

相关文档