更新时间:2024-10-28 GMT+08:00

Spark使用说明

MRS 3.3.0-LTS及之后的版本中,Spark2x服务改名为Spark,服务包含的角色名也有差异,例如JobHistory2x变更为JobHistory。

相关涉及服务名称、角色名称的描述和操作请以实际版本为准。

Spark是一个开源的,并行数据处理框架,能够帮助用户简单、快速的开发大数据应用,对数据进行离线处理、流式处理、交互式分析等。

相比于Hadoop,Spark拥有明显的性能优势。