Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Actualización más reciente 2023-11-20 GMT+08:00

ALM-38010 Topics con réplica única

Descripción

El sistema comprueba el número de réplicas de cada topic cada 60 segundos en el nodo donde reside el Controller de Kafka. Esta alarma se genera cuando hay una réplica para un topic.

Atributo

ID de alarma

Gravedad de la alarma

Borrado automáticamente

38010

Advertencia

No

Parámetros

Nombre

Significado

Source

Especifica el clúster para el que se genera la alarma.

ServiceName

Especifica el servicio para el que se genera la alarma.

RoleName

Especifica el rol para el que se genera la alarma.

TopicName

Especifica la lista de topics para los que se genera la alarma.

Impacto en el sistema

Existe el riesgo de punto único de falla (SPOF) para los temas con una sola réplica. Cuando el nodo donde reside la réplica se vuelve anormal, el partition no tiene un leader y los servicios del topic se ven afectados.

Causas posibles

  • El número de réplicas del topic está configurado incorrectamente.

Procedimiento

Comprobar el número de réplicas para el topic.

  1. En FusionInsight Manager, seleccione O&M > Alarm > Alarms, haga clic en de esta alarma y vea la lista TopicName en Location.
  2. Compruebe si es necesario agregar réplicas para el topic para el que se genera la alarma.

    • En caso afirmativo, vaya a 3.
    • Si no, vaya a 5.

  3. En el cliente de FusionInsight, vuelva a planificar las réplicas de topic y describa la distribución de particiones del topic en el archivo add-replicas-reassignment.json con el siguiente formato: {"partitions":[{"topic": "topic name","partition": 1,"replicas": [1,2] }],"version":1}. A continuación, ejecute el siguiente comando para agregar réplicas:

    kafka-reassign-partitions.sh --zookeeper {zk_host}:{port}/kafka --reassignment-json-file {manual assignment json file path} --execute

    Por ejemplo:

    /opt/client/Kafka/kafka/bin/kafka-reassign-partitions.sh --zookeeper 192.168.0.90:2181,192.168.0.91:2181,192.168.0.92:2181/kafka --reassignment-json-file add-replicas-reassignment.json --execute

  4. Ejecute el siguiente comando para comprobar el progreso de la ejecución de la tarea:

    kafka-reassign-partitions.sh --zookeeper {zk_host}:{port}/kafka --reassignment-json-file {manual assignment json file path} --verify

    Por ejemplo:

    /opt/client/Kafka/kafka/bin/kafka-reassign-partitions.sh --zookeeper 192.168.0.90:2181,192.168.0.91:2181,192.168.0.92:2181/kafka --reassignment-json-file add-replicas-reassignment.json --verify

  5. Después de completar las operaciones de manejo o de confirmar que la alarma no tiene impacto, borre manualmente la alarma en FusionInsight Manager.
  6. Después de un período de tiempo, compruebe si la alarma está desactivada.

    • Si lo es, no se requiere ninguna otra acción.
    • Si no es así, vaya a 7.

Recopilar información de fallas.

  1. En FusionInsight Manager, elija O&M > Log > Download.
  2. En el área Service , seleccione Kafka en el clúster requerido.
  3. Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
  4. Póngase en contacto con el y envíe los registros recopilados.

Eliminación de alarmas

Si la alarma no tiene impacto, borre la alarma manualmente.

Información relacionada

Ninguna