文档首页/ MapReduce服务 MRS/ 开发指南（普通版_2.x及之前）/ Spark开发指南/ 开发Spark应用/ 从HBase读取数据再写入HBase/ 场景说明

更新时间：2024-12-10 GMT+08:00

场景说明

场景说明

假定HBase的table1表存储用户当天消费的金额信息，table2表存储用户历史消费的金额信息。

现table1表有记录key=1,cf:cid=100，表示用户1在当天消费金额为100元。

table2表有记录key=1,cf:cid=1000，表示用户1的历史消息记录金额为1000元。

基于某些业务要求，要求开发Spark应用程序实现如下功能：

根据用户名累计用户的历史消费金额，即用户总消费金额=100(用户当天的消费金额) + 1000(用户历史消费金额)。

上例所示，运行结果table2表用户key=1的总消费金额为cf:cid=1100元。

数据规划

使用HBase shell工具，创建HBase table1和table2，并分别插入数据。

通过HBase创建名为table1的表，命令如下。

create 'table1', 'cf'
通过HBase插入数据，命令如下：

put 'table1', '1', 'cf:cid', '100'
通过HBase创建名为table2的表，命令如下。

create 'table2', 'cf'
通过HBase插入数据。

put 'table2', '1', 'cf:cid', '1000'

如果开启了kerberos认证，需要将客户端的配置文件“spark-defaults.conf”和sparkJDBC服务端中的配置项spark.yarn.security.credentials.hbase.enabled置为true。

开发思路

查询table1表的数据。
根据table1表数据的key值去table2表做查询。
把前两步相应的数据记录做连接操作。
把上一步骤的结果写到table2表。

父主题： 从HBase读取数据再写入HBase

上一篇：从HBase读取数据再写入HBase

下一篇：Java样例代码

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提交成功！非常感谢您的反馈，我们会继续努力做到更好！

系统繁忙，请稍后重试