Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Actualización más reciente 2023-11-20 GMT+08:00

ALM-24005 La transmisión de datos por Flume es anormal (Para MRS 2.x o anterior)

Descripción

El módulo de alarma monitoriza la capacidad de los canales de Flume. Esta alarma se genera si la duración en la que un canal está lleno o el número de veces que una fuente no envía datos al canal excede el umbral.

Los usuarios pueden establecer el umbral según sea necesario modificando el parámetro channelfullcount.

Esta alarma se borra después de que se suelte el espacio del canal Flume.

Atributo

ID de alarma

Severidad de alarma

Borrar automáticamente

24005

Grave

Parámetros

Parámetro

Descripción

ServiceName

Especifica el servicio para el que se genera la alarma.

HostName

Especifica el host para el que se genera la alarma.

ComponentType

Especifica el tipo de componente para el que se genera la alarma.

ComponentName

Especifica el nombre del componente para el que se genera la alarma.

Impacto en el sistema

Si el uso del Flume Channel continúa creciendo, el tiempo de transmisión de datos aumenta. Cuando el uso alcanza el 100%, se suspende el proceso del agente de Flume.

Causas posibles

  • El Flume sink está defectuoso.
  • La red está defectuosa.

Procedimiento

  1. Compruebe si el Flume sink es normal.

    1. Compruebe si el Flume sink es el tipo de HDFS.
      • En caso afirmativo, vaya a 1.b.
      • Si no, vaya a 1.c.
    2. En MRS Manager, compruebe si se informa de la alarma ALM-14000 Servicio HDFS no disponible y si se detiene el servicio HDFS.
      • Si se informa de la alarma, bórrela de acuerdo con las sugerencias de manejo de ALM-14000 Servicio HDFS no disponible; si el servicio HDFS está detenido, inícielo. Entonces vaya a 1.g.
      • Si no, vaya a 1.g.
    3. Compruebe si el Flume sink es el tipo de HBase.
      • En caso afirmativo, vaya a 1.d.
      • Si no, vaya a 1.g.
    4. En MRS Manager, compruebe si se informa de la alarma ALM-19000 Servicio HBase no disponible y si se detiene el servicio HBase.
      • Si se informa de la alarma, bórrela de acuerdo con las sugerencias de manejo de "ALM-19000 Servicio HBase no disponible"; si el servicio HBase está detenido, inícielo. Entonces vaya a 1.g.
      • Si no, vaya a 1.g.
    5. Compruebe si el Flume sink es del tipo de Kafka.
      • En caso afirmativo, vaya a 1.f.
      • Si no, vaya a 1.g.
    6. En MRS Manager, compruebe si se informa de la alarma ALM-38000 Servicio Kafka no disponible y si se detiene el servicio Kafka.
      • Si se informa de la alarma, bórrela de acuerdo con las sugerencias de manejo de "ALM-38000 Servicio Kafka no disponible"; si el servicio Kafka está detenido, inícielo. Entonces vaya a 1.g.
      • Si no, vaya a 1.g.
    7. Vaya a la página de detalles del clúster MRS y haga clic en Components.
    8. Elija Flume > Instances.
    9. Haga clic en la instancia Flume del nodo defectuoso y compruebe si el valor del Sink Speed Metrics es 0.
      • En caso afirmativo, vaya a 2.a.
      • En caso negativo, no se requiere ninguna otra acción.

  2. Compruebe el estado de la red entre el Flume sink y el nodo defectuoso.

    1. Compruebe si el Flume sink es del tipo de Avro.
      • En caso afirmativo, vaya a 2.c.
      • Si no, vaya a 3.
    2. Inicie sesión en el host donde reside el nodo defectuoso. Ejecute el siguiente comando para cambiar a usuario root:

      sudo su - root

    3. Ejecute el comando ping Flume sink IP address para comprobar si se puede hacer un ping al Flume sink.
      • En caso afirmativo, vaya a 3.
      • Si no, vaya a 2.d.
    4. Póngase en contacto con el administrador de red para reparar la red.
    5. Espere un rato y compruebe si la alarma está desactivada.
      • En caso afirmativo, no es necesario hacer nada más.
      • Si no, vaya a 3.

  3. Recopilar información de fallas.

    1. En MRS Manager, seleccione System > Export Log.
    2. Póngase en contacto con el personal de O&M y envíe los registros recopilados.

Información relacionada

N/A