更新时间:2022-08-16 GMT+08:00
GaussDB(DWS) 与Hive在功能上有哪些差别?
GaussDB(DWS) 与Hive在功能上存在一定的差异,主要体现在以下几个方面:
- Hive是基于Hadoop MapReduce的数据仓库,GaussDB(DWS) 是基于Postgres的MPP的数据仓库。
- Hive的数据在HDFS中存储,GaussDB(DWS) 的数据可以在本地存储,也可以通过外表的形式通过OBS进行存储。
- Hive不支持索引,GaussDB(DWS) 支持索引,所以查询速度GaussDB(DWS) 更快。
- Hive不支持存储过程,GaussDB(DWS) 支持存储过程,使用场景更广泛。
- GaussDB(DWS) 比Hive对SQL的支持更丰富,包括函数、自定义函数、存储过程。
- Hive不支持事务,GaussDB(DWS) 支持完整事务。
- 在数据可靠性方面,Hive和GaussDB(DWS) 均支持副本,可靠性基本一致。
- 在性能上,GaussDB(DWS) 极大地优于Hive。
GaussDB(DWS) 和Hive基于各自的功能特点,在应用场景上,Hive仅用于离线分析场景,GaussDB(DWS) 适用于在线分析场景及AD-Hoc(即席查询)场景。
父主题: 通用问题