GPU调度概述

工作负载支持使用节点GPU资源，GPU资源使用可以分为如下两种模式：

GPU静态分配（共享/独享）：按比例给Pod分配GPU显卡资源，支持独享（分配单张/多张显卡）和共享（部分显卡）方式。
GPU虚拟化：UCS On Premises GPU采用xGPU虚拟化技术，能够动态对GPU设备显存与算力进行划分，单个GPU卡最多虚拟化成20个GPU虚拟设备。相对于静态分配来说，虚拟化的方案更加灵活，最大程度保证业务稳定的前提下，可以完全由用户定义使用的GPU数量，提高GPU利用率。
GPU虚拟化功能优势如下：
- 灵活：精细配置GPU算力占比及显存大小，算力分配粒度为5%GPU，显存分配粒度达MB级别。
- 隔离：支持显存和算力的严格隔离，支持单显存隔离，算力与显存同时隔离两类场景。
- 兼容：业务无需重新编译，无需进行CUDA库替换，对业务无感。