MRS Spark
功能
通过MRS Spark节点实现在MRS中执行预先定义的Spark作业。
Spark是一个开源的,并行数据处理框架,能够帮助用户简单、快速地开发大数据应用,对数据进行离线处理、流式处理、交互式分析等。
参数
用户可参考表1,表2和表3配置MRS Spark节点的参数。
| 参数 | 是否必选 | 说明 | 
|---|---|---|
| 节点名称 | 是 | 节点名称,可以包含中文、英文字母、数字、“_”、“-”、“/”、“<”、“>”等各类特殊字符,长度为1~128个字符。 默认情况下,节点名称会与选择的脚本名称保持同步。若不需要节点名称和脚本名称同步,请参考禁用作业节点名称同步变化禁用该功能。 | 
| MRS集群名 | 是 | 选择MRS集群。 
        如需新建集群,请参考以下方法:
         
 | 
| MRS资源队列 | 否 | 选择已创建好的MRS资源队列。 
         说明: 
         您需要先在数据安全服务队列权限功能中,配置对应的队列后,才能在此处选择到已配置的队列。当有多处同时配置了资源队列时,此处配置的资源队列为最高优先级。 | 
| Spark作业名称 | 是 | MRS作业名称,只能由英文字母、数字、中划线和下划线组成,长度不能超过64个字符。 系统支持作业名称按照作业名称_节点名称格式自动填入。 
         说明: 
         作业名称不得包含中文字符、超出长度限制等。如果作业名称不符合规则,将导致提交MRS作业失败。 | 
| 运行模式 | 是 | 
        配置Spark作业的运行模式。
         
 注意,此处不会为Spark增加对应的batch或streaming模式参数,您还需要为Spark作业指定对应参数。 | 
| Jar包资源 | 是 | 选择Jar包。在选择Jar包之前,您需要先将Jar包上传至OBS桶中,并在“资源管理”页面中新建资源将Jar包添加到资源管理列表中,具体操作请参考新建资源。 
         说明: 
         如果管理中心数据连接配置的是MRS租户面连接,MRS认证类型为keytab认证类型,在跨region或跨云场景下,MRS Spark Jar包资源不支持设置obs jar。由于DataArts Studio与MRS不是对接同一个OBS时,DataArts Studio传递过去的OBS域名,MRS无法访问识别,导致访问OBS报错域名无法访问。 | 
| Jar包参数 | 否 | Jar包的参数。 | 
| 运行程序参数 | 否 | 为本次执行的作业配置相关优化参数(例如线程、内存、CPU核数等),用于优化资源使用效率,提升作业的执行性能。该参数由用户程序内的参数指定,MRS只负责参数的传入。 
         说明: 
         若集群为MRS 1.8.7版本或MRS 2.0.1之后版本,需要配置此参数。 MRS Spark作业的运行程序参数,请参见《MapReduce用户指南》中的运行Spark作业。 | 
| 输入数据路径 | 否 | 选择输入数据所在的路径。 | 
| 输出数据路径 | 否 | 选择输出数据存储的路径。 | 
| 参数 | 是否必选 | 说明 | 
|---|---|---|
| 节点状态轮询时间(秒) | 是 | 设置轮询时间(1~60秒),每隔x秒查询一次节点是否执行完成。 | 
| 节点执行的最长时间 | 是 | 设置节点执行的超时时间,如果节点配置了重试,在超时时间内未执行完成,该节点将会再次重试。 | 
| 失败重试 | 是 | 节点执行失败后,是否重新执行节点。 
 | 
| 当前节点失败后,后续节点处理策略 | 是 | 节点执行失败后的操作: 
 | 
| 是否空跑 | 否 | 如果勾选了空跑,该节点不会实际执行,将直接返回成功。 | 
| 任务组 | 否 | 选择任务组。任务组配置好后,可以更细粒度地进行当前任务组中的作业节点的并发数控制,比如作业中包含多个节点、补数据、重跑等场景。 | 
| 参数 | 说明 | 
|---|---|
| 输入 | |
| 新建 | 单击“新建”,在“类型”的下拉选项中选择要新建的类型。可以选择DWS,OBS,CSS,HIVE,CUSTOM和DLI类型。 | 
| 确定 | 单击“确认”,保存节点输入功能的参数配置。 | 
| 取消 | 单击“取消”,取消节点输入功能的参数配置。 | 
| 编辑 | 单击 | 
| 删除 | 单击 | 
| 查看表详情 | 单击 | 
| 输出 | |
| 新建 | 单击“新建”,在“类型”的下拉选项中选择要新建的类型。可以选择DWS,OBS,CSS,HIVE,CUSTOM和DLI类型。 | 
| 确定 | 单击“确认”,保存节点输出功能的参数配置。 | 
| 取消 | 单击“取消”,取消节点输出功能的参数配置。 | 
| 编辑 | 单击 | 
| 删除 | 单击 | 
| 查看表详情 | 单击 | 
 
     
      





