Principios básicos de Hue
Hue es un grupo de aplicaciones web que interactúan con componentes de big data de MRS. Le ayuda a explorar HDFS, realizar consultas de Hive e iniciar trabajos de MapReduce. Hue lleva aplicaciones que interactúan con todos los componentes de big data de MRS.
Hue proporciona las funciones del navegador de archivos y del editor de consultas:
- El navegador de archivos le permite navegar y operar directamente diferentes directorios de HDFS en la GUI.
- El editor de consultas puede escribir sentencias SQL simples para consultar datos almacenados en Hadoop, por ejemplo, HDFS, HBase y Hive. Con el editor de consultas, puede crear, gestionar y ejecutar sentencias de SQL fácilmente y descargar los resultados de la ejecución como un archivo de Excel.
En el WebUI proporcionado por Hue, puede realizar las siguientes operaciones en los componentes:
- HDFS:
- Ver, crear, gestionar, renombrar, mover y eliminar archivos o directorios.
- Cargar y descargar de archivos
- Buscar archivos, directorios, propietarios de archivos y grupos de usuarios; cambiar los propietarios y permisos de los archivos y directorios.
- Configurar manualmente las políticas de almacenamiento de directorios HDFS y las políticas de almacenamiento dinámico.
- Hive:
- Editar y ejecutar sentencias de SQL/HQL. Guardar, copiar y editar la plantilla de SQL/HQL. Explicar sentencias de SQL/HQL. Guardar la sentencia de SQL/HQL y consultarla.
- Presentación de la base de datos y presentación de la tabla de datos
- Soportar diferentes tipos de almacenamiento de Hadoop
- Utilizar MetaStore para agregar, eliminar, modificar y consultar bases de datos, tablas y vistas.
Si se utiliza Internet Explorer para acceder a la página Hue para ejecutar sentencias de HiveSQL, la ejecución falla porque el navegador tiene problemas funcionales. Se recomienda utilizar un navegador compatible, por ejemplo, Google Chrome.
- Impala:
- Editar y ejecutar sentencias de SQL/HQL. Guardar, copiar y editar la plantilla de SQL/HQL. Explicar sentencias de SQL/HQL. Guardar la sentencia de SQL/HQL y consultarla.
- Presentación de la base de datos y presentación de la tabla de datos
- Soportar diferentes tipos de almacenamiento de Hadoop
- Utilizar MetaStore para agregar, eliminar, modificar y consultar bases de datos, tablas y vistas.
Si se utiliza Internet Explorer para acceder a la página Hue para ejecutar sentencias de HiveSQL, la ejecución falla porque el navegador tiene problemas funcionales. Se recomienda utilizar un navegador compatible, por ejemplo, Google Chrome.
- MapReduce: compruebar las tareas de MapReduce que se están ejecutando o que se han finalizado en los clústeres, incluido su estado, la hora de inicio y finalización y logs de ejecución.
- Oozie: Hue proporciona la función gestor de trabajos Oozie, en este caso, puede usar Oozie en modo GUI.
- ZooKeeper: Hue proporciona la función del navegador de ZooKeeper para que utilice ZooKeeper en modo GUI.
Para obtener más información sobre Hue, consulte https://gethue.com/.
Arquitectura
Hue, que adopta el diseño MTV (Model-Template-View), es un programa de aplicación web que se ejecuta en Django Python. (Django Python es un marco de aplicaciones web que utiliza códigos de código abierto.)
Hue se compone de Proceso Supervisor y WebServer. Supervisor Process es el proceso principal de Hue que gestiona los procesos de aplicación. Supervisor Process y WebServer interactúan con aplicaciones en WebServer a través de las API de Thrift/REST, como se muestra en Figura 1.
Tabla 1 describe los componentes mostrados en Figura 1.
Nombre de la conexión |
Descripción |
---|---|
Supervisor Process |
Gestiona los procesos de las aplicaciones de WebServer, como iniciar, detener y supervisar los procesos. |
Hue WebServer |
Proporciona las siguientes funciones a través del marco de web de Django Python:
|