如何配置Pod使用GPU节点的加速能力?
问题描述
我已经购买了GPU节点,但运行速度还是很慢,请问如何配置Pod使用GPU节点的加速能力。
解答
方案1:
建议您将集群中GPU节点的不可调度的污点去掉,以便GPU插件驱动能够正常安装,同时您需要安装高版本的GPU驱动。
如果您的集群中有非GPU的容器,可以通过亲和、反亲和策略将这个容器不调度到GPU节点上。
方案2:
建议您安装高版本的GPU驱动,通过kubectl更新GPU插件的配置,增加配置如下:
tolerations: - operator: "Exists"
增加该配置后,可以使GPU插件驱动能够正常安装到打了污点的GPU节点上。