Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Centro de ayuda/ MapReduce Service/ Preguntas frecuentes/ Descripción de MRS/ ¿Cuál es la relación entre Hive y otros componentes?
Actualización más reciente 2023-11-20 GMT+08:00

¿Cuál es la relación entre Hive y otros componentes?

  • Hive y HDFS

    Hive es un proyecto de Apache Hadoop. Hive utiliza Hadoop Distributed File System (HDFS) como su sistema de almacenamiento de archivos. Hive analiza y procesa los datos estructurados almacenados en HDFS. Todos los archivos de datos de la base de datos Hive se almacenan en HDFS, y todas las operaciones de datos en Hive también se realizan mediante API de HDFS.

  • Hive y MapReduce

    Todo el cálculo de datos de Hive depende de MapReduce. MapReduce, también un proyecto Apache Hadoop, es un marco de computación paralela basado en HDFS. Durante el análisis de datos, Hive analiza las sentencias HiveQL enviadas por los usuarios en tareas de MapReduce y envía las tareas para que MapReduce lo ejecute.

  • Hive y DBService

    MetaStore (servicio de metadatos) de Hive procesa la estructura y la información de atributos sobre las bases de datos, tablas y particiones de Hive que se almacenan en una base de datos relacional. En MRS, DBService mantiene la base de datos relacional.

  • Hive y Spark

    La computación de datos Hive también se puede implementar en Spark. Spark, también un proyecto de Apache, es un marco de computación distribuida en memoria. Durante el análisis de datos, Hive analiza las sentencias de HiveQL enviadas por los usuarios en las tareas de Spark y envía las tareas para que Spark las ejecute.