Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Centro de ayuda/ MapReduce Service/ Guía del usuario/ Referencia de alarma (aplicable a MRS 3.x)/ ALM-12085 Error de volcado del registro de auditoría de servicio
Actualización más reciente 2023-11-20 GMT+08:00

ALM-12085 Error de volcado del registro de auditoría de servicio

Descripción

El sistema volca los registros de auditoría de servicio a las 03:00 todos los días y los almacena en el nodo OMS. Esta alarma se genera cuando el volcado falla. Esta alarma se borra cuando el próximo volcado tiene éxito.

Atributo

ID de alarma

Gravedad de la alarma

Borrar automáticamente

12085

Leves

Parámetros

Nombre

Significado

Source

Especifica el clúster o sistema para el que se genera la alarma.

ServiceName

Especifica el servicio para el que se genera la alarma.

RoleName

Especifica el rol para el que se genera la alarma.

HostName

Especifica el host para el que se genera la alarma.

Impacto en el sistema

Es posible que se pierdan los registros de auditoría del servicio.

Causas posibles

  • Los registros de auditoría del servicio están sobredimensionados.
  • El espacio de almacenamiento de la copia de respaldo de OMS es insuficiente.
  • El espacio de almacenamiento de un host donde se encuentra el servicio es insuficiente.

Procedimiento

Comprobar si los registros de auditoría del servicio están sobredimensionados.

  1. En la lista de alarmas del FusionInsight Manager, localice la fila que contiene la alarma y vea la dirección IP del host y la información adicional para la que se genera la alarma.
  2. Inicie sesión en el host donde se genera la alarma como usuario root.
  3. Ejecute el comando vi ${BIGDATA_LOG_HOME}/controller/scriptlog/getLogs.log para comprobar si se puede buscar la palabra clave "LOG SIZE is more than 5000MB".

    • Si puede, vaya a 4.
    • Si no puede, vaya a 5.

  4. Compruebe si los registros de auditoría de servicio de gran tamaño son causados por excepciones.

El espacio de almacenamiento de la copia de respaldo de OMS es insuficiente.

  1. Ejecute el comando vi ${BIGDATA_LOG_HOME}/controller/scriptlog/getLogs.log para comprobar si se puede buscar la palabra clave "Collect log failed, too many logs on".

    • Si puede, obtenga la dirección IP del host siguiendo la palabra clave "Collect log failed, too many logs on", y vaya a 6.
    • Si no puede, vaya a 11.

  2. Inicie sesión en el host con la dirección IP obtenida en 5 como usuario root.
  3. Ejecute el comando vi {BIGDATA_LOG_HOME}/nodeagent/scriptlog/collectLog.log para comprobar si se puede buscar la palabra clave "log size overs".

    • Si puede, vaya a 9.
    • Si no puede, vaya a 8.

  4. Compruebe si la información adicional de la alarma contiene la palabra clave "no enough space".

    • En caso afirmativo, vaya a 9.
    • Si no, vaya a 11.

  5. Realice las siguientes operaciones para ampliar la capacidad del disco (solo para MRS 3.1.2 y versiones anteriores) o reducir el número máximo de copias de seguridad de registros de auditoría:

    • Amplíe la capacidad del nodo OMS.
    • Ejecute el siguiente comando para editar el archivo y reducir el valor de MAX_NUM_BK_AUDITLOG.

      vi ${CONTROLLER_HOME}/etc/om/componentsauditlog.properties

  6. En el siguiente periodo de ejecución, 03:00, compruebe si la alarma está borrada.

    • Si lo es, no se requiere ninguna otra acción.
    • Si no es así, vaya a 11.

Comprobar si el espacio del host donde se encuentra el servicio es insuficiente.

  1. Ejecute el comando vi ${BIGDATA_LOG_HOME}/controller/scriptlog/getLogs.log para comprobar si se puede buscar la palabra clave "Collect log failed, no enough space on hostIp".

    • Si puede, obtenga la dirección IP del host anormal y diríjase a 12.
    • Si no puede, vaya a 15.

  2. Inicie sesión en el host con la dirección IP obtenida como usuario root y ejecute el comando df "$BIGDATA_HOME/tmp" -lP | tail -1 | awk '{print ($4/1024)}' para obtener el espacio restante del directorio log del host. Compruebe si el valor es inferior a 1000 MB.

    • Si lo es, vaya a 13.
    • Si no es así, vaya a 15.

  3. Amplíe la capacidad del nodo
  4. En el siguiente periodo de ejecución, 03:00, compruebe si la alarma está borrada.

    • Si lo es, no se requiere ninguna otra acción.
    • Si no es así, vaya a 15.

Recopilar información de fallas.

  1. En FusionInsight Manager, seleccione O&M> Log > Download.
  2. Seleccione Controller para Service y haga clic en OK.
  3. Haga clic en en la esquina superior derecha. En el cuadro de diálogo que se muestra, establezca Start Date y End Date en 10 minutos antes y después del tiempo de generación de alarmas respectivamente y haga clic en OK. A continuación, haga clic en Download.
  4. Póngase en contacto con el y envíe la información de registro recopilada.

Eliminación de alarmas

Esta alarma se borrará automáticamente después de que se corrija la falla.

Información relacionada

Ninguna