Extracción de un nodo
Escenario
Al quitar un nodo de un clúster se reinstala el sistema operativo del nodo y se borran los componentes de CCE en el nodo.
Quitar un nodo no eliminará el servidor correspondiente al nodo. Se recomienda quitar los nodos en horas fuera de pico para evitar impactos en sus servicios.
Después de eliminar un nodo del clúster, el nodo sigue ejecutando e incurre en las tarifas.
Notas y restricciones
- Los nodos solo se pueden quitar cuando el clúster se encuentra en estado Available o Unavailable.
- Un nodo de CCE se puede quitar solo cuando está en el estado Active, Abnormal o Error.
- Un nodo de CCE en el estado Active puede volver a instalar su sistema operativo y borrar los componentes de CCE después de que se quite.
- Si el sistema operativo no se reinstala después de quitar el nodo, vuelva a instalarlo manualmente. Después de la reinstalación, inicie sesión en el nodo y ejecute el script de liquidación para borrar los componentes de CCE. Para obtener más información, véase Manejo de la reinstalación fallida del sistema operativo.
- Quitar un nodo provocará la pérdida de datos de PVC/PV para el PV local asociado con el nodo. Estos PVC y PV no se pueden restaurar o utilizar de nuevo. En este escenario, el pod que utiliza el PV local se desaloja del nodo. Se crea un nuevo pod y permanece en el estado pendiente. Esto se debe a que el PVC utilizado por el pod tiene una etiqueta de nodo, debido a lo cual el pod no se puede programar.
Precauciones
- La eliminación de un nodo conducirá a la migración de pods, lo que puede afectar a los servicios. Realice esta operación durante las horas de menor actividad.
- Pueden producirse riesgos inesperados durante la operación. Realice una copia de respaldo de los datos por adelantado.
- Mientras se elimina el nodo, el backend establecerá el nodo en el estado no programado.
- Después de quitar el nodo y volver a instalar el sistema operativo, las particiones de LVM originales se borrarán y los datos administrados por LVM se borrarán. Por lo tanto, realice una copia de respaldo de los datos por adelantado.
Procedimiento
- Inicie sesión en la consola de CCE y haga clic en el nombre del clúster para acceder al clúster.
- Elija Nodes en el panel de navegación y elija More > Remove en la columna Operation del nodo de destino.
Figura 1 Quitar un nodo
También puede seleccionar varios nodos y quitarlos a la vez.
Figura 2 Quitar varios nodos a la vez
- En el cuadro de diálogo que se muestra, configure la información de inicio de sesión necesaria para volver a instalar el sistema operativo y haga clic en Yes. Espere hasta que se quite el nodo.
Después de quitar el nodo, los pods de carga de trabajo del nodo se migran automáticamente a otros nodos disponibles.
Manejo de la reinstalación fallida del sistema operativo
Puede realizar los siguientes pasos para volver a instalar el sistema operativo y borrar los componentes de CCE en el nodo si fallan los intentos anteriores:
- Inicie sesión en la consola de gestión del servidor y vuelva a instalar el sistema operativo. Para obtener más información, consulte Cambiar el sistema operativo.
- Inicie sesión en el servidor y ejecute los siguientes comandos para borrar los componentes de CCE y los datos de LVM:
Escriba las siguientes secuencias de comandos en el archivo clean.sh:
lsblk vgs --noheadings | awk '{print $1}' | xargs vgremove -f pvs --noheadings | awk '{print $1}' | xargs pvremove -f lvs --noheadings | awk '{print $1}' | xargs -i lvremove -f --select {} function init_data_disk() { all_devices=$(lsblk -o KNAME,TYPE | grep disk | grep -v nvme | awk '{print $1}' | awk '{ print "/dev/"$1}') for device in ${all_devices[@]}; do isRootDisk=$(lsblk -o KNAME,MOUNTPOINT $device 2>/dev/null| grep -E '[[:space:]]/$' | wc -l ) if [[ ${isRootDisk} != 0 ]]; then continue fi dd if=/dev/urandom of=${device} bs=512 count=64 return done exit 1 } init_data_disk lsblk
Ejecute el siguiente comando:
bash clean.sh