更新时间:2022-02-24 GMT+08:00

MRS Spark

功能

通过MRS Spark节点实现在MRS中执行预先定义的Spark作业。

参数

用户可参考表1表2配置MRS Spark节点的参数。

表1 属性参数

参数

是否必选

说明

节点名称

节点名称,可以包含中文、英文字母、数字、“_”“-”“/”“<”“>”等各类特殊字符,长度为1~128个字符。

MRS集群名

选择MRS集群。

如需新建集群,请参考以下方法:
  • 单击,进入“集群列表”页面新建MRS集群。
  • 前往MRS管理控制台进行新建。

Spark作业名称

MRS作业名称,只能包含英文字母、数字、“_”,且长度为1~64个字符。

Jar包资源

选择Jar包。在选择Jar包之前,您需要先将Jar包上传至OBS桶中,并在“资源管理”页面中新建资源将Jar包添加到资源管理列表中,具体操作请参考新建资源

Jar包参数

Jar包的参数。

运行程序参数

为本次执行的作业配置相关优化参数(例如线程、内存、CPU核数等),用于优化资源使用效率,提升作业的执行性能。

说明:

若集群为MRS 1.8.7版本或MRS 2.0.1之后版本,需要配置此参数。

MRS Spark作业的运行程序参数,请参见《MapReduce用户指南》中的运行Spark作业

输入数据路径

选择输入数据所在的路径。

输出数据路径

选择输出数据存储的路径。

表2 高级参数

参数

是否必选

说明

节点状态轮询时间(秒)

设置轮询时间(1~60秒),每隔x秒查询一次节点是否执行完成。

节点执行的最长时间

设置节点执行的超时时间,如果节点配置了重试,在超时时间内未执行完成,该节点将不会再重试,直接置为失败状态。

失败重试

节点执行失败后,是否重新执行节点

  • 是:重新执行节点,请配置以下参数。
    • 最大重试次数
    • 重试间隔时间(秒)
  • 否:默认值,不重新执行节点
说明:

如果作业节点配置了重试,并且配置了超时时间,该节点执行超时后将不会再重试,直接置为失败状态。

失败策略

节点执行失败后的操作:

  • 终止当前作业执行计划
  • 继续执行下一作业
  • 挂起当前作业执行计划
  • 终止当前以及后续节点执行计划