MRS Spark Python
功能
通过MRS Spark Python节点实现在MRS中执行预先定义的Spark Python作业。
MRS Spark Python算子的具体使用教程,请参见开发一个MRS Spark Python作业。
参数
用户可参考表1,表2和表3配置MRS Spark Python节点的参数。
参数 | 是否必选 | 说明 |
|---|---|---|
节点名称 | 是 | 节点名称,可以包含中文、英文字母、数字、“_”、“-”、“/”、“<”、“>”等各类特殊字符,长度为1~128个字符。 |
作业名称 | 是 | MRS作业名称,只能由英文字母、数字、中划线和下划线组成,长度不能超过64个字符。 系统支持作业名称按照作业名称_节点名称格式自动填入。 说明: 作业名称不得包含中文字符、超出长度限制等。如果作业名称不符合规则,将导致提交MRS作业失败。 |
脚本类型 | 是 |
|
MRS集群名 | 是 | 选择支持spark python的mrs集群。MRS只有特定版本支持spark python的集群,请先测试运行,保证集群支持。 如需新建集群,请参考以下方法:
如何新建集群,请参见《MapReduce服务(MRS) 使用指南》中的创建集群章节。 |
MRS资源队列 | 否 | 选择已创建好的MRS资源队列。 说明: 您需要先在数据安全服务队列权限功能中,配置对应的队列后,才能在此处选择到已配置的队列。当有多处同时配置了资源队列时,此处配置的资源队列为最高优先级。 |
SQL脚本 | 是 | 仅“脚本类型”配置为“在线脚本”时可以配置。 选择已创建的Spark Python脚本。 |
运行程序参数 | 否 | 仅“脚本类型”配置为“在线脚本”时可以配置。 为本次执行的作业配置相关优化参数(例如线程、内存、CPU核数等),用于优化资源使用效率,提升作业的执行性能。 说明: 若集群为MRS 1.8.7版本或MRS 2.0.1之后版本,需要配置此参数。 MRS Spark作业的运行程序参数,请参见《MapReduce用户指南》中的运行Spark作业。 |
参数 | 是 | 仅“脚本类型”配置为“离线脚本”时可以配置。 输入参数信息,多个参数间使用Enter键分隔。 |
执行程序参数 | 否 | 仅“脚本类型”配置为“在线脚本”时可以配置。 输入MRS的执行程序参数。 不同参数间用空格隔开,可通过在参数名前添加@的方式防止参数信息被明文存储。 说明: 请勿输入敏感信息,例如ak、sk、password、authorization等信息。 |
属性 | 否 | 输入key=value格式的参数,多个参数间使用Enter键分割。 |
参数 | 是否必选 | 说明 |
|---|---|---|
节点执行的最长时间 | 是 | 设置节点执行的超时时间,如果节点配置了重试,在超时时间内未执行完成,该节点将会再次重试。 |
失败重试 | 是 | 节点执行失败后,是否重新执行节点。
|
当前节点失败后,后续节点处理策略 | 是 | 节点执行失败后的操作:
|
是否空跑 | 否 | 如果勾选了空跑,该节点不会实际执行,将直接返回成功。 |
任务组 | 否 | 选择任务组。任务组配置好后,可以更细粒度地进行当前任务组中的作业节点的并发数控制,比如作业中包含多个节点、补数据、重跑等场景。 |
参数 | 说明 |
|---|---|
输入 | |
新建 | 单击“新建”,在“类型”的下拉选项中选择要新建的类型。可以选择DWS,OBS,CSS,HIVE,CUSTOM和DLI类型。 |
确定 | 单击“确认”,保存节点输入功能的参数配置。 |
取消 | 单击“取消”,取消节点输入功能的参数配置。 |
编辑 | 单击 |
删除 | 单击 |
查看表详情 | 单击 |
输出 | |
新建 | 单击“新建”,在“类型”的下拉选项中选择要新建的类型。可以选择DWS,OBS,CSS,HIVE,CUSTOM和DLI类型。 |
确定 | 单击“确认”,保存节点输出功能的参数配置。 |
取消 | 单击“取消”,取消节点输出功能的参数配置。 |
编辑 | 单击 |
删除 | 单击 |
查看表详情 | 单击 |








