Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Centro de ayuda/ Cloud Container Engine/ Preguntas frecuentes/ Nodo/ Ejecución de nodo/ ¿Cómo configuro un pod para usar la capacidad de aceleración de un nodo de GPU?
Actualización más reciente 2023-08-08 GMT+08:00

¿Cómo configuro un pod para usar la capacidad de aceleración de un nodo de GPU?

Descripción del problema

He comprado un nodo de GPU, pero la velocidad de funcionamiento sigue siendo lenta. ¿Cómo configuro el pod para que utilice la capacidad de aceleración del nodo de GPU?

Solución

Solución 1:

Se recomienda quitar las manchas no programadas de los nodos de la GPU en el clúster, para que el controlador de complemento de GPU se pueda instalar correctamente. Además, es necesario instalar el controlador de GPU de una versión posterior.

Si no se despliega un contenedor en un nodo de GPU del clúster, puede configurar políticas de afinidad y antiafinidad para evitar que el contenedor se programe en el nodo de GPU.

Solución 2:

Se recomienda instalar el controlador de GPU de una versión posterior y utilizar kubectl para actualizar la configuración de complemento de GPU.Add the following configuration:

tolerations:
- operator: "Exists"

Después de agregar la configuración, el controlador de complemento de GPU se puede instalar correctamente en el nodo de GPU con un taint.