更新时间:2024-11-29 GMT+08:00

配置Hive常用参数

参数入口

请参考修改集群服务配置参数进入Hive服务配置页面。

参数说明

表1 Hive参数说明

参数

参数说明

默认值

hive.auto.convert.join

Hive基于输入文件大小将普通join转为mapjoin的开关。

说明:

在使用Hive进行联表查询,且关联的表无大小表的分别(小表数据<24M)时,建议将此参数值改为false,如果此时将此参数设置为true,执行联表查询时无法生成新的mapjoin。

取值范围:

  • true
  • false

默认值为true

hive.default.fileformat

Hive使用的默认文件格式。

RCFile

hive.exec.reducers.max

Hive提交的MR任务中reducer的最大个数。

999

hive.server2.thrift.max.worker.threads

HiveServer内部线程池,最大能启动的线程数量。

1000

hive.server2.thrift.min.worker.threads

HiveServer内部线程池,初始化时启动的线程数量。

5

hive.hbase.delete.mode.enabled

从Hive删除HBase记录的功能开关。如果启用,用户可以使用“remove table xx where xxx”从Hive中删除HBase记录。

true

hive.metastore.server.min.threads

MetaStore启动的用于处理连接的线程数,如果超过设置的值之后,MetaStore就会一直维护不低于设定值的线程数,即常驻MetaStore线程池的线程会维护在指定值之上。

200

hive.server2.enable.doAs

HiveServer2在与其他服务(如YARN、HDFS等)会话时是否模拟客户端用户。如果将此配置项从false改成true,会导致只有列权限的用户访问相应表权限缺失。

true