¿Por qué el pod no escribe datos?
Eventos de pod
El sistema de archivos del nodo donde se encuentra el pod está dañado. Como resultado, el pod recién creado no puede escribir datos en /var/lib/kubelet/device-plugins/.xxxxx. Pueden ocurrir eventos similares a los siguientes en el pod:
Message: Pod Update Plugin resources failed due to failed to write checkpoint file "kubelet_internal_checkpoint": open /var/lib/kubelet/device-plugins/.xxxxxx: read-only file system, which is unexpected.
Tales pods anormales se registran en eventos de error pero no ocupan recursos del sistema.
Procedimiento
Hay muchas causas para las excepciones del sistema de archivos, por ejemplo, el nodo principal físico se enciende o apaga inesperadamente. Si los sistemas de archivos no se restauran y un gran número de pods se vuelve anormal (lo que no afecta a los servicios), realice los siguientes pasos:
- Ejecute el comando kubectl drain <node-name> para marcar el nodo como no programado y desaloje los pods existentes a otros nodos.
kubectl drain <node-name>
- Localice la causa de la excepción del sistema de archivos y rectifique la falla.
- Ejecute el siguiente comando para hacer que el nodo sea programable:
kubectl uncordon <node-name>
Limpieza de los pod anormales
- El mecanismo de recolección de basura de kubelet es el mismo que el de la comunidad. Después de borrar el propietario (por ejemplo, Deployment) del pod, también se borra el pod anormal.
- Puede ejecutar el comando kubelet para eliminar el pod registrado como anormal.
Anomalías de la carga de trabajo Preguntas frecuentes
- ¿Cómo uso eventos para corregir cargas de trabajo anormales?
- ¿Qué debo hacer si falla la programación de pods?
- ¿Qué debo hacer si un pod no logra extraer la imagen?
- ¿Qué debo hacer si falla el inicio del contenedor?
- ¿Qué debo hacer si un pod no es desalojado?
- ¿Qué debo hacer si no se puede montar un volumen de almacenamiento o si el tiempo de montaje se agota?
- ¿Qué debo hacer si una carga de trabajo permanece en el estado de creación?
- ¿Qué debo hacer si no se pueden eliminar los pods en el estado de terminación?
- ¿Qué debo hacer si una carga de trabajo se detiene debido a la eliminación de pods?
- ¿Qué debo hacer si se produce un error al desplegar un servicio en el nodo de GPU?
- ¿Qué debo hacer si se notifican los errores relacionados con sandbox cuando el pod permanece en el estado de creación?
- ¿Por qué el pod no escribe datos?
- ¿Por qué se suspende la creación o eliminación de pods en un nodo donde está montado el almacenamiento de archivos?
- Códigos de salida
Comentarios
¿Le pareció útil esta página?
Deje algún comentariomore