更新时间:2022-12-14 GMT+08:00

Impala与其他组件有什么关系?

  • Impala与HDFS间的关系

    Impala默认利用HDFS作为其文件存储系统。Impala通过解析和计算处理结构化的数据,Hadoop HDFS则为Impala提供了高可靠性的底层存储支持。使用Impala将无需移动HDFS中的数据并且提供更快的访问。

  • Impala与Hive间的关系

    Impala使用Hive的元数据、ODBC驱动程序和SQL语法。与Hive不同,Impala不基于MapReduce算法,它实现了一个基于守护进程的分布式架构,它负责在同一台机器上运行的查询执行的所有方面。因此,它减少了使用MapReduce的延迟,这使Impala比Hive快。

  • Impala与MapReduce间的关系

  • Impala与Spark间的关系

  • Impala与Kudu间的关系

    Kudu与Impala紧密集成,替代Impala+HDFS+Parquet组合。允许使用Impala的SQL语法从Kudu tablets插入、查询、更新和删除数据。此外,还可以用 JDBC或ODBC,Impala作为代理连接Kudu进行数据操作。

  • Impala与HBase间的关系

    默认的Impala表使用存储在HDFS上的数据文件,这对于使用全表扫描的批量加载和查询是理想的。但是,HBase可以提供对OLTP样式组织的数据的便捷高效查询。