ALM-12052 El uso de puertos de TCP temporales supera el umbral (Para MRS 2.x o anterior)
Descripción
El sistema comprueba el uso de puertos de TCP temporales cada 30 segundos. Esta alarma se genera cuando el uso de puertos TCP temporales excede el umbral (el umbral predeterminado es de 80%) varias veces (el valor predeterminado es de 5).
Puede cambiar el umbral seleccionando System > Threshold Configuration > Host > Network Status > TCP Ephemeral Port Usage > TCP Ephemeral Port Usage.
Si el hit number es de 1, esta alarma se borra cuando el uso de puertos de TCP temporales es menor o igual al umbral. Si el hit number es mayor que 1, esta alarma se borra cuando el uso de puertos de TCP temporales es menor o igual al 90% del umbral.
Atributo
ID de alarma |
Gravedad de alarma |
Borrar automáticamente |
---|---|---|
12052 |
Grave |
Sí |
Parámetros
Parámetro |
Descripción |
---|---|
ServiceName |
Especifica el servicio para el que se genera la alarma. |
RoleName |
Especifica el rol para el que se genera la alarma. |
HostName |
Especifica el host para el que se genera la alarma. |
Trigger Condition |
Especifica el umbral para activar la alarma. |
Impacto en el sistema
Los servicios en el host no pueden establecer conexiones con el externo y los servicios se interrumpen.
Causas posibles
- Los puertos temporales no cumplen con los requisitos de servicio.
- El sistema no funciona normalmente.
Procedimiento
Expandir el rango de puertos temporales.
- Vaya a la página de detalles del clúster de MRS y elija Alarms.
- En la lista de alarmas en tiempo real, haga clic en la alarma. En el área Alarm Details, obtenga la dirección IP del host para el que se genera la alarma.
- Utilice PuTTY para iniciar sesión en el host para el que se genera la alarma como usuario omm.
- Ejecute el comando cat /proc/sys/net/ipv4/ip_local_port_range |cut -f 1 para obtener el número de puerto de inicio. Ejecute el comando cat /proc/sys/net/ipv4/ip_local_port_range |cut -f 2 para obtener el número de puerto final. Reste el número de puerto inicial del número de puerto final para obtener el número total de puertos temporales. Si el número total de puertos temporales es inferior a 28,232, el rango de puertos aleatorios del sistema operativo es demasiado pequeño. En este caso, póngase en contacto con el administrador del sistema para ampliar el rango de puertos.
- Ejecute el comando ss -ant 2>/dev/null | grep -v LISTEN | awk 'NR > 2 {print $4}'|cut -d ':' -f 2 | awk '$1 >"start port number" {print $1}' | sort -u | wc -l para calcular el número de puertos temporales usados.
- Calcule el uso de puertos temporales utilizando la siguiente fórmula: Uso de puertos temporales = (Número de puertos temporales usados/Número total de puertos temporales) x 100. Compruebe si el uso excede el umbral.
- Espere 5 minutos y compruebe si la alarma está desactivada.
- En caso afirmativo, no es necesario hacer nada más.
- Si no, vaya a 8.
Comprobar si el entorno de sistema es normal.
- Ejecute el siguiente comando para importar el archivo temporal y ver los puertos más utilizados en el archivo port_result.txt:
netstat -tnp > $BIGDATA_HOME/tmp/port_result.txt
netstat -tnp Active Internet connections (w/o servers) Proto Recv Send LocalAddress ForeignAddress State PID/ProgramName tcp 0 0 10-120-85-154:45433 10-120-8:25009 CLOSE_WAIT 94237/java tcp 0 0 10-120-85-154:45434 10-120-8:25009 CLOSE_WAIT 94237/java tcp 0 0 10-120-85-154:45435 10-120-8:25009 CLOSE_WAIT 94237/java ...
- Ejecute el siguiente comando para comprobar los procesos que ocupan un gran número de puertos:
ps -ef |grep PID
- PID indica el ID de proceso del puerto consultado en 8.
- Ejecute el siguiente comando para recopilar información sobre todos los procesos del sistema y comprobar los procesos que ocupan un gran número de puertos:
- Póngase en contacto con el administrador del sistema para despejar los procesos que ocupan un gran número de puertos. Espere 5 minutos y compruebe si la alarma está desactivada.
- En caso afirmativo, no es necesario hacer nada más.
- Si no, vaya a 11.
- Recopilar información de fallas.
- En MRS Manager, seleccione .
- Póngase en contacto con el personal de O&M y envíe los registros recopilados.
Referencia
Ninguna