ALM-38010 Topics con réplica única
Descripción
El sistema comprueba el número de réplicas de cada topic cada 60 segundos en el nodo donde reside el Controller de Kafka. Esta alarma se genera cuando hay una réplica para un topic.
Atributo
ID de alarma |
Gravedad de la alarma |
Borrado automáticamente |
---|---|---|
38010 |
Advertencia |
No |
Parámetros
Nombre |
Significado |
---|---|
Source |
Especifica el clúster para el que se genera la alarma. |
ServiceName |
Especifica el servicio para el que se genera la alarma. |
RoleName |
Especifica el rol para el que se genera la alarma. |
TopicName |
Especifica la lista de topics para los que se genera la alarma. |
Impacto en el sistema
Existe el riesgo de punto único de falla (SPOF) para los temas con una sola réplica. Cuando el nodo donde reside la réplica se vuelve anormal, el partition no tiene un leader y los servicios del topic se ven afectados.
Causas posibles
- El número de réplicas del topic está configurado incorrectamente.
Procedimiento
Comprobar el número de réplicas para el topic.
- En FusionInsight Manager, seleccione O&M > Alarm > Alarms, haga clic en de esta alarma y vea la lista TopicName en Location.
- Compruebe si es necesario agregar réplicas para el topic para el que se genera la alarma.
- En el cliente de FusionInsight, vuelva a planificar las réplicas de topic y describa la distribución de particiones del topic en el archivo add-replicas-reassignment.json con el siguiente formato: {"partitions":[{"topic": "topic name","partition": 1,"replicas": [1,2] }],"version":1}. A continuación, ejecute el siguiente comando para agregar réplicas:
kafka-reassign-partitions.sh --zookeeper {zk_host}:{port}/kafka --reassignment-json-file {manual assignment json file path} --execute
Por ejemplo:
/opt/client/Kafka/kafka/bin/kafka-reassign-partitions.sh --zookeeper 192.168.0.90:2181,192.168.0.91:2181,192.168.0.92:2181/kafka --reassignment-json-file add-replicas-reassignment.json --execute
- Ejecute el siguiente comando para comprobar el progreso de la ejecución de la tarea:
kafka-reassign-partitions.sh --zookeeper {zk_host}:{port}/kafka --reassignment-json-file {manual assignment json file path} --verify
Por ejemplo:
/opt/client/Kafka/kafka/bin/kafka-reassign-partitions.sh --zookeeper 192.168.0.90:2181,192.168.0.91:2181,192.168.0.92:2181/kafka --reassignment-json-file add-replicas-reassignment.json --verify
- Después de completar las operaciones de manejo o de confirmar que la alarma no tiene impacto, borre manualmente la alarma en FusionInsight Manager.
- Después de un período de tiempo, compruebe si la alarma está desactivada.
- Si lo es, no se requiere ninguna otra acción.
- Si no es así, vaya a 7.
Recopilar información de fallas.
- En FusionInsight Manager, elija O&M > Log > Download.
- En el área Service , seleccione Kafka en el clúster requerido.
- Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
- Póngase en contacto con el y envíe los registros recopilados.
Eliminación de alarmas
Si la alarma no tiene impacto, borre la alarma manualmente.
Información relacionada
Ninguna