ALM-16004 El servicio Hive no está disponible (Para MRS 2.x o anterior)
Descripción
El sistema comprueba el estado del servicio Hive cada 30 segundos. Esta alarma se genera cuando el servicio Hive no está disponible.
Esta alarma se borra cuando se recupera el servicio Hive.
Atributo
ID de alarma |
Severidad de alarma |
Borrar automáticamente |
---|---|---|
16004 |
Crítica |
Sí |
Parámetros
Parámetro |
Descripción |
---|---|
ServiceName |
Especifica el servicio para el que se genera la alarma. |
RoleName |
Especifica el rol para el que se genera la alarma. |
HostName |
Especifica el host para el que se genera la alarma. |
Impacto en el sistema
El sistema no puede proporcionar servicios de carga, consulta y extracción de datos.
Causas posibles
- Los servicios básicos, como ZooKeeper HDFS, Yarn y DBService funcionan incorrectamente o el proceso Hive es defectuoso.
- ZooKeeper es anormal.
- HDFS es anormal.
- Yarn es anormal.
- DBService es anormal.
- El proceso de servicio de Hive es defectuoso. Si la alarma es causada por una falla del proceso Hive, el informe de alarma tiene un retraso de aproximadamente 5 minutos.
- La comunicación de red entre el servicio Hive y los servicios básicos se interrumpe.
Procedimiento
- Compruebe el estado del proceso HiveServer/MetaStore.
- Vaya a la página de detalles del clúster MRS y haga clic en Components.
- Elija Hive > Instances. En la lista de instancias de Hive, compruebe si el estado de todas las instancias de HiveSserver/MetaStore es Unknown.
- Encima de la lista de instancias de Hive, elija More > Restart Instance para reiniciar el proceso HiveServer/MetaStore.
- En la lista de alarmas, compruebe si ALM-16004 Servicio Hive no disponible está desactivado.
- En caso afirmativo, no es necesario hacer nada más.
- Si no, vaya a 2.
- Compruebe el estado del ZooKeeper.
- Vaya a la página de detalles del clúster y elija Alarms.
- En MRS Manager, compruebe si se notifica la alarma ALM-12007 Falla de proceso.
- En el área Alarm Details de la falla de proceso ALM-12007, compruebe si ServiceName es ZooKeeper.
- Rectifique la falla siguiendo los pasos proporcionados en ALM-12007 Falla de proceso.
- En la lista de alarmas, compruebe si ALM-16004 Servicio Hive no disponible está desactivado.
- En caso afirmativo, no es necesario hacer nada más.
- Si no, vaya a 3.
- Compruebe el estado de HDFS.
- Vaya a la página de detalles del clúster y elija Alarms.
- En la lista de alarmas, compruebe si existe la alarma ALM-14000 Servicio HDFS no disponible.
- Rectifique la falla siguiendo los pasos proporcionados en ALM-14000 El servicio HDFS no disponible.
- En la lista de alarmas, compruebe si ALM-16004 Servicio Hive no disponible está desactivado.
- En caso afirmativo, no es necesario hacer nada más.
- Si no, vaya a 4.
- Compruebe el estado de Yarn.
- Vaya a la página de detalles del clúster y elija Alarms.
- En la lista de alarmas de MRS Manager, compruebe si se genera la alarma ALM-18000 Servicio Yarn no disponible.
- Rectifique la falla siguiendo los pasos proporcionados en ALM-18000 Servicio Yarn no disponible.
- En la lista de alarmas, compruebe si ALM-16004 Servicio Hive no disponible está desactivado.
- En caso afirmativo, no es necesario hacer nada más.
- Si no, vaya a 4.
- Compruebe el estado de DBService.
- Vaya a la página de detalles del clúster y elija Alarms.
- En la lista de alarmas en MRS Manager, compruebe si se genera ALM-27001 DBService no disponible.
- Rectificar la falla siguiendo el procedimiento de tratamiento en ALM-27001 DBService no disponible (Para MRS 2.x o anterior).
- En la lista de alarmas, compruebe si ALM-16004 Servicio Hive no disponible está desactivado.
- En caso afirmativo, no es necesario hacer nada más.
- Si no, vaya a 6.
- Compruebe la conexión de red entre Hive y ZooKeeper, HDFS, Yarn y DBService.
- Vaya a la página de detalles del clúster MRS y haga clic en Components.
- Haga clic en Hive.
- Haga clic en Instances.
Se muestra la lista de instancias HiveServer.
- Haga clic en Host Name en la fila de HiveServer.
Se muestra la página de estado del host HiveServer.
- Registre la dirección IP en Summary.
- Utilice la dirección IP obtenida en el archivo 6.e para iniciar sesión en el host donde se encuentra HiveServer.
- Ejecute el comando ping para comprobar si la conexión de red entre el host que ejecuta HiveServer y los hosts que ejecutan los servicios ZooKeeper, HDFS, Yarn, y DBService es normal. Los métodos para obtener direcciones IP de los hosts que ejecutan servicios ZooKeeper, HDFS, Yarn, y DBService, así como la dirección IP HiveServer son los mismos.
- Póngase en contacto con el personal de O&M para restaurar la red.
- En la lista de alarmas, compruebe si ALM-16004 Servicio Hive no disponible está desactivado.
- En caso afirmativo, no es necesario hacer nada más.
- Si no, vaya a 7.
- Recopilar información de fallas.
- En MRS Manager, elija System > Export Log.
- Póngase en contacto con el personal de O&M y envíe los registros recopilados.
Referencia
Ninguna