文档首页/ MapReduce服务 MRS/ 组件操作指南（LTS版）/ 使用Hudi/ 使用spark-sql操作Hudi表

更新时间：2025-11-26 GMT+08:00

查看PDF

使用spark-sql操作Hudi表

操作场景

本章节主要介绍通过spark-sql使用Hudi功能。

前提条件

在Manager界面创建用户并添加hadoop和hive用户组，主组加入hadoop。

约束与限制

本章节仅适用于MRS 3.5.0-LTS及之前版本。

操作步骤

下载并安装Hudi客户端，具体请参考安装MRS客户端章节。

目前Hudi集成在Spark中，用户从Manager页面下载Spark客户端即可，例如客户端安装目录为：“/opt/client”。
使用root登录客户端安装节点，执行如下命令：

cd /opt/client
执行命令加载环境变量：

source bigdata_env

source Hudi/component_env

kinit 创建的用户
- 新创建的用户需要修改密码，更改密码后重新kinit登录。
- 普通模式（未开启kerberos认证）无需执行kinit命令。
- 多服务场景下，在source bigdata_env之后，请先source Spark服务的component_env，再去source Hudi的component_env。
启动spark-sql。
- 创建Hudi表：
  create table if not exists hudi_table2 (id int,name string,price double) using hudi options (type = 'cow',primaryKey = 'id',preCombineField = 'price');
- 插入数据：
  insert into hudi_table2 select 1,1,1;
  
  insert into hudi_table2 select 2,1,1;
- 更新数据：
  update hudi_table2 set name=3 where id=1;
- 删除数据：
  delete from hudi_table2 where id=2;
- 查询数据：
  select * from hudi_table2;

父主题： 使用Hudi

上一篇：使用Spark Shell创建Hudi表

下一篇：Hudi写操作

相关文档

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

盘古Doer提问云社区提问