基于Python的Hive样例程序

功能介绍

本章节介绍如何使用Python连接Hive执行数据分析任务。

样例代码

使用Python方式提交数据分析任务，参考样例程序中的“hive-examples/python-examples/pyCLI_sec.py”。该样例程序连接的集群的认证模式是安全模式，运行样例程序之前需要使用kinit命令认证相应权限的Kerberos用户。

导入HAConnection类。

 from pyhs2.haconnection import HAConnection

声明HiveServer的IP地址列表。本例中hosts代表HiveServer的节点，xxx.xxx.xxx.xxx代表业务IP地址。
```
hosts = ["xxx.xxx.xxx.xxx", "xxx.xxx.xxx.xxx"] 
```
如果HiveServer实例被迁移，原始的示例程序会失效。在HiveServer实例迁移之后，用户需要更新示例程序中使用的HiveServer的IP地址。
配置Kerberos主机名和服务名。本例中“krb_host”参数值为“hadoop.实际域名”，实际域名可登录FusionInsight Manager，选择“系统 > 权限 > 域和互信 > 本端域” 查看；主机名为hadoop，服务名为hive。
```
conf = {"krb_host":"hadoop.<系统域名>", "krb_service":"hive"}     
```

创建连接，执行HQL，样例代码中仅执行查询所有表功能，可根据实际情况修改HQL内容，输出查询的列名和结果到控制台。

   try: 
       with HAConnection(hosts = hosts, 
                          port = 10000, 
                          authMechanism = "KERBEROS", 
                          configuration = conf) as haConn: 
           with haConn.getConnection() as conn: 
               with conn.cursor() as cur: 
                   # show databases 
                   print cur.getdatabases() 
                    
                   # execute query 
                   cur.execute("show tables") 
                    
                   # return column info from query 
                   print cur.getschema() 
                    
                   # fetch table results 
                   for i in cur.fetch(): 
                       print i 
                        
   except exception, e: 
       print e

父主题： 开发Hive应用

上一篇：HCatalog访问Hive样例程序

下一篇：基于Python3的Hive样例程序

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消