更新时间:2024-11-29 GMT+08:00
MRS存算分离简介
MRS支持在大数据存储容量大、计算资源需要弹性扩展的场景下,用户将数据存储在OBS服务中,使用MRS集群仅作数据计算处理的存算分离模式,从而实现按需灵活扩展资源、低成本的海量数据分析方案。
大数据存算分离场景,请务必使用OBS并行文件系统,使用普通对象桶会对集群性能产生较大影响。
存算分离功能使用流程:
- 配置存算分离集群。
请选择如下其中一种配置即可(推荐使用委托方式)。
- 通过为MRS集群绑定ECS委托方式访问OBS,避免了AK/SK直接暴露在配置文件中的风险,具体请参考配置存算分离集群(委托方式)。
- 在MRS集群中配置AK/SK,AK/SK会明文暴露在配置文件中,请谨慎使用,具体请参考配置存算分离集群(AKSK方式)。
- MRS通过集群内的Guardian组件对接OBS,为其他组件提供获取访问OBS的临时认证凭据、细粒度权限控制的能力,具体请参考配置Guardian服务对接OBS。
- 目前仅MRS 3.3.0-LTS及之后的版本支持基于Guardian组件对接OBS,其他版本集群请参考MRS集群组件对接OBS(基于委托)相关章节进行配置。
- 基于Guardian存算分离管理面作业提交依赖JobGateway模式,不支持Executor模式。
- 使用存算分离集群。
在具备OBS资源的访问权限后,MRS集群内相关组件可通过客户端访问对应文件资源。
各组件访问OBS配置说明可参考如下内容:
父主题: 配置存算分离