ALM-16002 La tasa de éxito de ejecución de Hive SQL es inferior al umbral (Para MRS 2.x o anterior)
Descripción
El sistema comprueba el porcentaje de las sentencias de HiveQL que se ejecutan correctamente cada 30 segundos. Porcentaje de sentencias HiveQL ejecutadas correctamente = Número de sentencias HiveQL ejecutadas correctamente por Hive en un periodo determinado/Número total de sentencias HiveQL ejecutadas por Hive. Este indicador se puede ver en la página de monitoreo del servicio Hive. Esta alarma se genera cuando el porcentaje de las sentencias HiveQL que se ejecutan correctamente excede el umbral especificado (90% de forma predeterminada). El nombre del host para el que se genera la alarma se puede obtener a partir de la información de ubicación de la alarma. La dirección IP del host es la dirección IP del nodo HiveServer.
Esta alarma se borra cuando el porcentaje de las sentencias HiveQL que se ejecutan correctamente en un período de prueba es menor o igual que el umbral.
Atributo
ID de alarma |
Severidad de alarma |
Borrar automáticamente |
---|---|---|
16002 |
Grave |
Sí |
Parámetros
Parámetro |
Descripción |
---|---|
ServiceName |
Especifica el servicio para el que se genera la alarma. |
RoleName |
Especifica el rol para el que se genera la alarma. |
HostName |
Especifica el host para el que se genera la alarma. |
Trigger condition |
Especifica el umbral para activar la alarma. |
Impacto en el sistema
La configuración y el rendimiento del sistema no pueden cumplir los requisitos de procesamiento del servicio.
Causas posibles
- Se produce un error de sintaxis en los comandos HiveQL.
- El servicio HBase es anormal cuando se está realizando una tarea Hive on HBase.
- Los servicios básicos de los que depende son anormales, como HDFS, Yarn y ZooKeeper.
Procedimiento
- Compruebe si los comandos HiveQL cumplen con la sintaxis.
- Utilice el cliente Hive para iniciar sesión en el nodo HiveServer para el que se genera la alarma. Consulte el estándar de sintaxis HiveQL proporcionado por Apache y compruebe si los comandos HiveQL son correctos. Para obtener más información, consulte https://cwiki.apache.org/confluence/display/hive/languagemanual.
Para ver al usuario que ejecuta una sentencia incorrecta, descargue los registros de HiveServerAudit del nodo HiveServer para el que se genera esta alarma. Ajuste Start time y End time a 10 minutos antes y después del tiempo de generación de alarma respectivamente. Abra el archivo de registro y busque la palabra clave Result=FAIL para filtrar la información de registro sobre la sentencia incorrecta y, a continuación, vea el usuario que ejecuta la sentencia incorrecta según UserName en la información de registro.
- Ingrese las sentencias HiveQL correctas y compruebe si el comando se puede ejecutar correctamente.
- Utilice el cliente Hive para iniciar sesión en el nodo HiveServer para el que se genera la alarma. Consulte el estándar de sintaxis HiveQL proporcionado por Apache y compruebe si los comandos HiveQL son correctos. Para obtener más información, consulte https://cwiki.apache.org/confluence/display/hive/languagemanual.
- Compruebe si el servicio HBase es anormal.
- Compruebe si el servicio Spark es anormal.
- Compruebe si HDFS, Yarn y ZooKeeper son normales.
- Vaya a la página de detalles del clúster MRS y haga clic en Components.
- En la lista de servicios, compruebe si los servicios, como HDFS, Yarn y ZooKeeper son normales.
- Compruebe las alarmas mostradas en la página de alarmas y bórrelas según Alarm Help.
- Ingrese las sentencias HiveQL correctas y compruebe si el comando se puede ejecutar correctamente.
- Espere un minuto y compruebe si la alarma está desactivada.
- En caso afirmativo, no es necesario hacer nada más.
- Si no, vaya a 5.
- Recopilar información de fallas.
- En MRS Manager, elija System > Export Log.
- Póngase en contacto con el personal de O&M y envíe los registros recopilados.
Referencia
Ninguna