¿Cómo manejo un fallo de red del IB?
Fallo de comunicación de RDMA entre dos ECS de IB
- Compruebe si las claves en los dos ECS son consistentes.
Ejecute el siguiente comando para comprobar las claves asignadas a los ECS:
cat /sys/class/infiniband/mlx5_0/ports/1/pkeys/* | grep -v "0x0000"
Figura 1 Comprobación de la coherencia de Pkey- Si solo se obtiene una clave, póngase en contacto con el soporte técnico.
- Si se obtienen dos Pkeys, asegúrese de que las dos Pkeys en los dos ECSs son iguales.
- Ejecute el siguiente comando para comprobar si el firewall está deshabilitado:
Figura 2 Comprobación del firewall
Si el firewall no está deshabilitado, ejecute el siguiente comando para deshabilitarlo:
service firewalld stop
- Compruebe si el comando de comunicación RDMA es correcto.
Ejecute el siguiente comando en ECS 1 (cliente):
ib_write_lat -x 0 --pkey_index 0 192.168.0.218
Ejecute el siguiente comando en ECS 2 (servidor):
ib_write_lat -x 0 --pkey_index 0
Sin dirección IP para el puerto IB de ECS
Si ejecuta ifconfig y el resultado del comando muestra que no se ha asignado ninguna dirección IP al puerto de InfiniBand ECS (IB):
- Ejecute el siguiente comando para comprobar la clave:
cat /sys/class/infiniband/mlx5_0/ports/1/pkeys/* | grep -v "0x0000"
Figura 3 Comprobando PkeySi solo se obtiene una clave, póngase en contacto con el soporte técnico.
- Ejecute el siguiente comando para asignar una dirección IP al puerto ECS IB:
Si no se muestra ningún resultado del comando, la dirección IP no se puede obtener mediante DHCP.
- Póngase en contacto con el servicio de asistencia técnica.
Después de haber realizado los pasos anteriores, si la red del IB aún no se puede utilizar para la comunicación o el puerto del IB aún no puede obtener una dirección IP, póngase en contacto con el servicio de asistencia técnica para obtener asistencia y proporcione al ingeniero de asistencia técnica la siguiente información.
Artículo
Descripción
Ejemplo
Valor
VPC1 ID
ID de VPC 1
Ejemplo: fef65559-c154-4229-afc4-9ad0314437ea
N/A
VM1 ID
ID de ECS 1 en VPC 1
Ejemplo: f7619b12-3683-4203-9271-f34f283cd740
N/A
VM2 ID
ID de ECS 2 en VPC 1
Ejemplo: f75df766-68aa-4ef3-a493-06cdc26ac37a
N/A