基于Python3的Hive样例程序

本章节介绍如何使用Python3连接Hive执行数据分析任务。

安全模式连接Hive前需要使用集群客户端进行认证，使用kinit命令认证相应权限的Kerberos用户，认证后执行分析任务示例在“hive-examples/python3-examples/pyCLI_sec.py”文件中。

导入hive类
```
from pyhive import hive
```
创建JDBC连接。
```
connection = hive.Connection(host='hiveserverIp', port=hiveserverPort, username='hive', database='default', auth='KERBEROS', kerberos_service_name="hive", krbhost='hadoop.hadoop.com')
```
需按照实际环境修改以下参数：
- hiveserverIp：替换为实际需要连接的HiveServer节点IP地址，可登录FusionInsight Manager，选择“集群 > 服务 > Hive > 实例”查看。
- hiveserverPort：需要替换为Hive服务的端口，可在FusionInsight Manager界面，选择“集群 > 服务 > Hive > 配置”，在搜索框中搜索“hive.server2.thrift.port”查看，默认值为“10000”。
- username：参数值为实际使用的用户名，即准备集群认证用户信息创建的用户名。
- kerberos_service_name：参数值为实际连接的实例，以连接Hive为例，修改为：kerberos_service_name="hive"。
- krbhost：参数值为“hadoop.实际域名”，实际域名可登录FusionInsight Manager，选择“系统 > 权限 > 域和互信 > 本端域” 查看。
执行SQL语句，样例代码中仅执行查询所有表功能，可根据实际情况修改HQL内容。
```
cursor = connection.cursor()
cursor.execute('show tables')
```

获取结果并输出

for result in cursor.fetchall():
    print(result)

父主题： 开发Hive应用

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消