Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.

Centro de ayuda/ MapReduce Service/ Guía del usuario/ Referencia de alarma (aplicable a MRS 3.x)/ ALM-38006 El porcentaje de Partition de Kafka que no están completamente sincronizadas supera el umbral

Actualización más reciente 2023-11-20 GMT+08:00

Ver PDF

ALM-38006 El porcentaje de Partition de Kafka que no están completamente sincronizadas supera el umbral

Descripción

El sistema comprueba el porcentaje de Partition de Kafka que no están completamente sincronizadas con el número total de Partition cada 60 segundos. Esta alarma se genera cuando el porcentaje excede el umbral (50% por defecto) durante 3 veces consecutivas.

Cuando el Trigger Count es 1, esta alarma se borra cuando el porcentaje es menor o igual al umbral. Cuando el Trigger Count es mayor que 1, esta alarma se borra cuando el porcentaje es menor o igual al 90% del umbral.

Atributo

ID de alarma	Gravedad de la alarma	Borrado automáticamente
38006	Importante	Sí

Parámetros

Nombre	Significado
Source	Especifica el clúster para el que se genera la alarma.
ServiceName	Especifica el servicio para el que se genera la alarma.
RoleName	Especifica el rol para el que se genera la alarma.
Trigger Condition	Especifica el umbral que activa la alarma. Si el valor del indicador actual excede este umbral, se genera la alarma.

Impacto en el sistema

Demasiadas Partitions de Kafka que no están completamente sincronizadas afectan a la confiabilidad del servicio. Además, los datos pueden perderse cuando se conmutan Leader.

Causas posibles

Algunos nodos en los que reside la instancia del Broker son anormales o dejan de ejecutarse. Como resultado, las réplicas de algunas Partitions en Kafka están fuera del conjunto de réplicas in-sync (ISR).

Procedimiento

Comprobar instancias de Broker.

En el portal del FusionInsight Manager, seleccione Cluster > Name of the desired cluster > Services > Kafka > Instance. Se muestra la página de instancias de Kafka.
Compruebe si existen nodos defectuosos entre todos los nodos del Broker.
- En caso afirmativo, registre el nombre de host del nodo y vaya a 3.
- Si no, vaya a 5.
En el portal del FusionInsight Manager, haga clic en O&M > Alarm > Alarms para comprobar si la falla descrita en 2 existe en la información de alarma y manejar la alarma basándose en los métodos correspondientes.
En el portal del FusionInsight Manager, seleccione Cluster > Name of the desired cluster > Services > Kafka > Instance. Se muestra la página de instancias de Kafka.
Compruebe si existen nodos detenidos entre todas las instancias del Broker.
- En caso afirmativo, vaya a 6.
- Si no, vaya a 7.
Seleccione todas las instancias de Broker detenidas y haga clic en Start Instance.
Verifique si la alarma se ha borrado.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 8.

Recopilar información de fallas.

En el portal de FusionInsight Manager, seleccione O&M > Log > Download.
Seleccione Kafka en el clúster requerido en la lista desplegable Service.
Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
Póngase en contacto con el y envíe los registros recopilados.