Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Centro de ayuda> MapReduce Service> Guía del usuario> Referencia de alarma (aplicable a MRS 3.x)> ALM-24004 Se produce una excepción cuando Flume lee datos
Actualización más reciente 2023-11-20 GMT+08:00

ALM-24004 Se produce una excepción cuando Flume lee datos

Descripción

El módulo de alarma monitoriza el estado de Flume Source. Esta alarma se genera inmediatamente cuando la duración en la que Source no puede leer los datos excede el umbral.

El umbral predeterminado es 0, lo que indica que el umbral está deshabilitado. Puede cambiar el umbral modificando el archivo properties.properties en el directorio conf. Específicamente, modifique el parámetro NoDatatime de source requerido.

La alarma se borra cuando Source lee los datos y se completa el manejo de la alarma.

Atributo

ID de alarma

Gravedad de la alarma

Borrar automáticamente

24004

Importante

Parámetros

Nombre

Significado

Source

Especifica el clúster para el que se genera la alarma.

ServiceName

Especifica el servicio para el que se genera la alarma.

HostName

Especifica el host para el que se genera la alarma.

AgentId

Especifica el ID del agente para el que se genera la alarma.

ComponentType

Especifica el tipo de componente para el que se genera la alarma.

ComponentName

Especifica el nombre del componente para el que se genera la alarma.

Impacto en el sistema

Si se encuentran datos en el origen de datos y Flume Source continuamente no puede leer datos, la recopilación de datos se detiene.

Causas posibles

  • Flume Source está defectuoso, por lo que los datos no se pueden enviar.
  • La red está defectuosa, por lo que los datos no se pueden enviar.

Procedimiento

Comprobar si Flume Source está defectuoso.

  1. Abra el archivo de configuración properties.properties en el PC local, busque keyword type = spooldir en el archivo y compruebe si el tipo de Flume source es spoolDir.

    • En caso afirmativo, vaya a 2.
    • Si no, vaya a 3.

  2. Vea el directorio spoolDir para comprobar si todos los archivos ya se han transferido.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 5.

      El directorio de monitorización de spooDir se especifica mediante el parámetro .spoolDir en el archivo de configuración properties.properties. Si se han transferido todos los archivos del directorio de supervisión, la extensión del nombre de archivo de todos los archivos del directorio de supervisión es .COMPLETED.

  3. Abra el archivo de configuración properties.properties en el PC local, busque org.apache.flume.source.kafka.KafkaSource en el archivo y compruebe si el tipo de Flume source es Kafka.

    • En caso afirmativo, vaya a 4.
    • Si no, vaya a 7.

  4. Compruebe si se han agotado los datos del tema configurados por Kafka Source.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 5.

  5. En FusionInsight Manager, elija Cluster > Name of the desired cluster > Services > Flume > Instance.
  6. Vaya a la página de instancia de Flume del nodo defectuoso para comprobar si el indicador Source Speed Metrics en la alarma es 0.

    • En caso afirmativo, vaya a 11.
    • Si no, vaya a 7.

Verificar la conexión de red entre el nodo defectuoso y el nodo que corresponde a la dirección IP de Flume Source.

  1. Abra el archivo de configuración properties.properties en el PC local, busque type = avro en el archivo y compruebe si el tipo de Flume source es Avro.

    • En caso afirmativo, vaya a 8.
    • Si no, vaya a 11.

  2. Inicie sesión en el nodo defectuoso como usuario root, y ejecute el comando ping IP address of the Flume source para comprobar si el host del mismo nivel se puede hacer ping correctamente.

    • En caso afirmativo, vaya a 11.
    • Si no, vaya a 9.

  3. Póngase en contacto con el administrador de red para restaurar la red.
  4. En la lista de alarmas, compruebe si la alarma se borra después de un período.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 11.

Recopilar información de fallas.

  1. En FusionInsight Manager, seleccione O&M. En el panel de navegación de la izquierda, elija Log > Download.
  2. Expanda la lista desplegable Service y seleccione Flume para el clúster de destino.
  3. Haga clic en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 1 hora antes y después del tiempo de generación de alarma, respectivamente. A continuación, haga clic en Download.
  4. Póngase en contacto con y proporcione los registros recopilados.

Eliminación de alarmas

Esta alarma se borra automáticamente después de rectificar la falla.

Información relacionada

Ninguna