更新时间:2025-07-14 GMT+08:00

Hive ORC数据存储优化

操作场景

“ORC”是一种高效的列存储格式,在压缩比和读取效率上优于其他文件格式。

建议使用“ORC”作为Hive表默认的存储格式。

前提条件

已登录Hive客户端,具体操作请参见Hive客户端使用实践

操作步骤

  • 推荐:使用“SNAPPY”压缩,适用于压缩比和读取效率要求均衡场景。
    create table xx (col_name data_type) stored as orc tblproperties ("orc.compress"="SNAPPY");

    xx为具体使用的Hive表名。

  • 可用:使用“ZLIB”压缩,适用于压缩比要求较高场景。
    create table xx (col_name data_type) stored as orc tblproperties ("orc.compress"="ZLIB");

    xx为具体使用的Hive表名。