Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Centro de ayuda/ MapReduce Service/ Preguntas frecuentes/ Descripción de MRS/ ¿Cuál es la relación entre Impala y otros componentes?
Actualización más reciente 2023-11-20 GMT+08:00

¿Cuál es la relación entre Impala y otros componentes?

  • Impala y HDFS

    Impala utiliza HDFS como su sistema de almacenamiento de archivos. Impala analiza y procesa datos estructurados, mientras que HDFS proporciona almacenamiento subyacente confiable. Impala proporciona acceso rápido a los datos sin mover los datos en HDFS.

  • Impala y Hive

    Impala utiliza metadatos Hive, el controlador Open Database Connectivity (ODBC) y la sintaxis SQL. A diferencia de Hive, que es sobre MapReduce, Impala implementa una arquitectura distribuida basada en daemon y maneja todas las ejecuciones de consultas en el mismo nodo. Por lo tanto, Impala es más rápido que Hive al reducir la latencia causada por MapReduce.

  • Impala y MapReduce

    Ninguna

  • Impala y Spark

    Ninguna

  • Impala y Kudu

    Kudu se puede integrar estrechamente con Impala para reemplazar la combinación de Impala, HDFS y Parquet. Puede insertar, consultar, actualizar y eliminar datos en tabletas Kudu utilizando la sintaxis SQL de Impala. Además, puede usar JDBC u ODBC para conectarse a Kudu para operaciones de datos, usando Impala como el broker.

  • Impala y HBase

    Las tablas Impala predeterminadas utilizan archivos de datos almacenados en HDFS, lo que es ideal para la carga por lotes y consulta de escaneo de tablas completas. Sin embargo, HBase proporciona consultas convenientes y eficientes de datos de organización de estilo OLTP.