文档首页/ MapReduce服务 MRS/ 开发指南（普通版_3.x）/ Hive开发指南（普通模式）/ Hive应用开发概述/ Hive应用开发简介

更新时间：2025-10-28 GMT+08:00

Hive应用开发简介

Hive简介

Hive是一个开源的，建立在Hadoop上的数据仓库框架，提供类似SQL的HQL语言操作结构化数据，其基本原理是将HQL语言自动转换成MapReduce任务或Spark任务，从而完成对Hadoop集群中存储的海量数据进行查询和分析。

Hive主要特点如下：

通过HQL语言非常容易地完成数据提取、转换和加载（ETL）。
通过HQL完成海量结构化数据分析。
灵活的数据存储格式，支持JSON、CSV、TEXTFILE、RCFILE、ORCFILE、SEQUENCEFILE等存储格式，并支持自定义扩展。
多种客户端连接方式，支持JDBC接口。

Hive的主要应用于海量数据的离线分析（如日志分析，集群状态分析）、大规模的数据挖掘（用户行为分析，兴趣分区，区域展示）等场景下。

为保证Hive服务的高可用性、用户数据的安全及访问服务的可控制，在开源社区的Hive-3.1.0版本基础上，Hive新增如下特性：

数据文件加密机制：开源社区的Hive特性，请参见https://cwiki.apache.org/confluence/display/hive/designdocs。

父主题： Hive应用开发概述

上一篇：Hive应用开发概述

下一篇：Hive应用开发常用概念

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提交成功！非常感谢您的反馈，我们会继续努力做到更好！

系统繁忙，请稍后重试