更新时间:2023-03-08 GMT+08:00

GaussDB(DWS) 与Hive在功能上有哪些差别?

GaussDB(DWS) 与Hive在功能上存在一定的差异,主要体现在以下几个方面:

  1. Hive是基于Hadoop MapReduce的数据仓库,GaussDB(DWS) 是基于Postgres的MPP的数据仓库。
  2. Hive的数据在HDFS中存储,GaussDB(DWS) 的数据可以在本地存储,也可以通过外表的形式通过OBS进行存储。
  3. Hive不支持索引,GaussDB(DWS) 支持索引,所以查询速度GaussDB(DWS) 更快。
  4. Hive不支持存储过程,GaussDB(DWS) 支持存储过程,使用场景更广泛。
  5. GaussDB(DWS) 比Hive对SQL的支持更丰富,包括函数、自定义函数、存储过程。
  6. Hive不支持事务,GaussDB(DWS) 支持完整事务。
  7. 在数据可靠性方面,Hive和GaussDB(DWS) 均支持副本,可靠性基本一致。
  8. 在性能上,GaussDB(DWS) 极大地优于Hive。

GaussDB(DWS) 和Hive基于各自的功能特点,在应用场景上,Hive仅用于离线分析场景,GaussDB(DWS) 适用于在线分析场景及AD-Hoc(即席查询)场景。