更新时间:2024-10-28 GMT+08:00
Spark使用说明
MRS 3.3.0-LTS及之后的版本中,Spark2x服务改名为Spark,服务包含的角色名也有差异,例如JobHistory2x变更为JobHistory。
相关涉及服务名称、角色名称的描述和操作请以实际版本为准。
Spark是一个开源的,并行数据处理框架,能够帮助用户简单、快速的开发大数据应用,对数据进行离线处理、流式处理、交互式分析等。
相比于Hadoop,Spark拥有明显的性能优势。
父主题: 使用Spark/Spark2x