MRS Flink Job
功能
通过MRS Flink Job节点执行数据开发模块中预先定义的Flink SQL脚本和Flink作业。
Flink是一个批处理和流处理结合的统一计算框架,其核心是一个提供了数据分发以及并行化计算的流数据处理引擎。它的最大亮点是流处理,是业界最顶级的开源流处理引擎。
MRS Flink Job节点的具体使用教程,请参见开发一个MRS Flink作业。
参数
参数 |
是否必选 |
说明 |
---|---|---|
节点名称 |
是 |
节点名称,可以包含中文、英文字母、数字、“_”、“-”、“/”、“<”、“>”等各类特殊字符,长度为1~128个字符。 |
作业类型 |
是 |
选择
|
脚本路径 |
是 |
选择Flink SQL作业时,可配置此参数。 选择需要执行的Flink SQL脚本。如果脚本未创建,请参考新建脚本和开发SQL脚本先创建和开发Flink SQL脚本。 |
脚本参数 |
否 |
选择Flink SQL作业时,可配置此参数。 关联的SQL脚本如果使用了参数,此处显示参数名称,请在参数名称后的输入框配置参数值。参数值支持使用EL表达式。 若关联的SQL脚本,脚本参数发生变化,可单击刷新按钮 |
运行模式 |
是 |
配置Flink作业的运行模式。
注意,此处不会为Flink增加对应的batch或streaming模式参数,您还需要为Flink作业指定对应参数。 |
MRS集群名 |
是 |
选择MRS集群。
如需新建集群,请参考以下方法:
|
Flink作业名称 |
是 |
MRS作业名称,只能由英文字母、数字、中划线和下划线组成,长度不能超过64个字符。 系统支持作业名称按照作业名称_节点名称格式自动填入。
说明:
作业名称不得包含中文字符、超出长度限制等。如果作业名称不符合规则,将导致提交MRS作业失败。 |
Flink作业资源包 |
是 |
选择Jar包。在选择Jar包之前,您需要先将Jar包上传至OBS桶中,并在“资源管理”页面中新建资源将Jar包添加到资源管理列表中,具体操作请参考新建资源。
说明:
如果管理中心数据连接配置的是MRS租户面连接,MRS认证类型为keytab认证类型,在跨region或跨云场景下,MRS Flink作业资源包不支持设置obs jar。由于DataArts Studio与MRS不是对接同一个OBS时,DataArts Studio传递过去的OBS域名,MRS无法访问识别,导致访问OBS报错域名无法访问。 |
Flink作业执行参数 |
否 |
Flink作业执行的程序关键参数,该参数由用户程序内的函数指定。多个参数间使用空格隔开。 |
MRS资源队列 |
否 |
选择已创建好的MRS资源队列。
说明:
需要先在数据安全服务队列权限功能中,配置对应的队列后,才能在此处选择到已配置的队列。当有多处同时配置了资源队列时,此处配置的资源队列为最高优先级。 |
运行程序参数 |
否 |
为本次执行的作业配置相关优化参数(例如线程、内存、CPU核数等),用于优化资源使用效率,提升作业的执行性能。
说明:
若集群为MRS 1.8.7版本或MRS 2.0.1之后版本,需要配置此参数。 MRS Flink作业的运行程序参数,请参见《MapReduce用户指南》中的运行Flink作业。 |
输入数据路径 |
否 |
选择输入数据所在的路径。支持HDFS和OBS两种数据存储路径方式。 |
输出数据路径 |
否 |
选择输出数据存储的路径。支持HDFS和OBS两种数据存储路径方式。 |
参数 |
是否必选 |
说明 |
---|---|---|
节点执行的最长时间 |
是 |
设置节点执行的超时时间,如果节点配置了重试,在超时时间内未执行完成,该节点将会再次重试。 |
失败重试 |
是 |
节点执行失败后,是否重新执行节点。
|
当前节点失败后,后续节点处理策略 |
是 |
节点执行失败后的操作:
|
是否空跑 |
否 |
如果勾选了空跑,该节点不会实际执行,将直接返回成功。 |
任务组 |
否 |
选择任务组。任务组配置好后,可以更细粒度地进行当前任务组中的作业节点的并发数控制,比如作业中包含多个节点、补数据、重跑等场景。 |