Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Centro de ayuda> MapReduce Service> Guía del usuario> Referencia de alarma (aplicable a MRS 3.x)> ALM-38008 Estado anormal del directorio de datos de Kafka
Actualización más reciente 2023-11-20 GMT+08:00

ALM-38008 Estado anormal del directorio de datos de Kafka

Descripción

El sistema comprueba el estado del directorio de datos Kafka cada 60 segundos. Esta alarma se genera cuando el sistema detecta que el estado de un directorio de datos es anormal.

Trigger Count está establecido en 1. Esta alarma se borra cuando el estado del directorio de datos se vuelve normal.

Atributo

ID de alarma

Gravedad de la alarma

Borrado automáticamente

38008

Importante

Parámetros

Nombre

Significado

Source

Especifica el clúster para el que se genera la alarma.

ServiceName

Especifica el servicio para el que se genera la alarma.

RoleName

Especifica el rol para el que se genera la alarma.

HostName

Especifica el nombre de host para el que se genera la alarma.

DirName

Especifica el nombre del directorio para el que se genera la alarma.

Trigger Condition

Especifica la condición de que el estado del directorio de datos Kafka es anormal.

Impacto en el sistema

Si el estado del directorio de datos Kafka es anormal, las réplicas actuales de todas las particiones en el directorio de datos se ponen fuera de línea, y el estado del directorio de datos de múltiples nodos es anormal al mismo tiempo. Como resultado, es posible que algunas particiones no estén disponibles.

Causas posibles

  • El permiso del directorio de datos está alterado.
  • El disco donde se encuentra el directorio de datos está defectuoso.

Procedimiento

Verificar el permiso en el directorio de datos defectuoso.

  1. Encuentre la información del host en la información de alarma e inicie sesión en el host.
  2. En la información de alarma, compruebe si el directorio de datos y sus subdirectorios pertenecen al grupo omm:wheel.

    • En caso afirmativo, registre el nombre de host del nodo y vaya a 4.
    • Si no, vaya a 3.

  3. Restaurar el grupo propietario del directorio de datos y sus subdirectorios a omm:wheel.

    • En caso afirmativo, vaya a 6.
    • Si no, vaya a 5.

Comprobar si el disco donde se encuentra el directorio de datos está defectuoso.

  1. En el directorio de nivel superior del directorio de datos, cree y elimine archivos como usuario omm. Compruebe si la lectura/escritura de datos en el disco es normal.
  2. Reemplace o repare el disco donde se encuentra el directorio de datos para asegurarse de que la lectura/escritura de datos en el disco sea normal.
  3. En la página principal del FusionInsight Manager, elija Cluster > Name of the desired cluster > Services > Kafka > Instance. En la página de instancia de Kafka que se muestra, reinicie la instancia del Broker en el host registrado en 2.
  4. Una vez iniciado el Broker, compruebe si la alarma está desactivada.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 8.

Recopilar información de fallas.

  1. En FusionInsight Manager, elija O&M > Log > Download.
  2. En el área Service , seleccione Kafka en el clúster requerido.
  3. Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
  4. Póngase en contacto con el y envíe los registros recopilados.

Eliminación de alarmas

Después de rectificar la falla, el sistema borra automáticamente esta alarma.

Información relacionada

Ninguna