更新时间:2023-11-01 GMT+08:00

MRS Flink Job

功能

通过MRS Flink Job节点执行数据开发模块中预先定义的Flink SQL脚本和Flink作业。

MRS Flink Job节点的具体使用教程,请参见开发一个MRS Flink作业

参数

用户可参考表1表2配置MRS Flink节点的参数。

表1 属性参数

参数

是否必选

说明

节点名称

节点名称,可以包含中文、英文字母、数字、“_”“-”“/”“<”“>”等各类特殊字符,长度为1~128个字符。

作业类型

选择

  • Flink SQL作业
  • Flink 自定义作业

脚本路径

选择Flink SQL作业时,可配置此参数。

选择需要执行的Flink SQL脚本。如果脚本未创建,请参考新建脚本开发SQL脚本先创建和开发Flink SQL脚本。

脚本参数

选择Flink SQL作业时,可配置此参数。

关联的SQL脚本如果使用了参数,此处显示参数名称,请在参数名称后的输入框配置参数值。参数值支持使用EL表达式

若关联的SQL脚本,脚本参数发生变化,可单击刷新按钮同步。

运行模式

配置Flink作业的运行模式。
  • 批处理:指Flink作业为批模式运行,节点会一直等待Flink作业执行完成才结束。
  • 流处理:指Flink作业为流处理运行模式,节点执行时只要作业启动成功即执行成功。后续每次周期运行时检查任务是否处于运行状态,如果处于运行状态,则认为节点执行成功。

注意,此处不会为Flink增加对应的batch或streaming模式参数,您还需要为Flink作业指定对应参数。

MRS集群名

选择MRS集群。

如需新建集群,请参考以下方法:
  • 单击,进入“集群列表”页面新建MRS集群。
  • 前往MRS管理控制台进行新建。
    说明:

    MRS Flink Job目前支持的MRS集群版本是MRS 3.2.0-LTS.1及以上版本。

Flink作业名称

MRS作业名称,只能包含英文字母、数字、“_”,且长度为1~64个字符。

说明:

作业名称不得包含中文字符、超出长度限制等。如果作业名称不符合规则,将导致提交MRS作业失败。

Flink作业资源包

选择Jar包。在选择Jar包之前,您需要先将Jar包上传至OBS桶中,并在“资源管理”页面中新建资源将Jar包添加到资源管理列表中,具体操作请参考新建资源

Flink作业执行参数

Flink作业执行的程序关键参数,该参数由用户程序内的函数指定。多个参数间使用空格隔开。

MRS资源队列

选择已创建好的MRS资源队列。

说明:

需要先在数据安全服务队列权限功能中,配置对应的队列后,才能在此处选择到已配置的队列。当有多处同时配置了资源队列时,此处配置的资源队列为最高优先级。

运行程序参数

为本次执行的作业配置相关优化参数(例如线程、内存、CPU核数等),用于优化资源使用效率,提升作业的执行性能。

说明:

若集群为MRS 1.8.7版本或MRS 2.0.1之后版本,需要配置此参数。

MRS Flink作业的运行程序参数,请参见《MapReduce用户指南》中的运行Flink作业

输入数据路径

选择输入数据所在的路径。

输出数据路径

选择输出数据存储的路径。

表2 高级参数

参数

是否必选

说明

节点执行的最长时间

设置节点执行的超时时间,如果节点配置了重试,在超时时间内未执行完成,该节点将会再次重试。

失败重试

节点执行失败后,是否重新执行节点

  • 是:重新执行节点,请配置以下参数。
    • 超时重试
    • 最大重试次数
    • 重试间隔时间(秒)
  • 否:默认值,不重新执行节点
    说明:

    如果作业节点配置了重试,并且配置了超时时间,该节点执行超时后,系统支持再重试。

    当节点运行超时导致的失败不会重试时,您可前往“默认项设置”修改此策略。

    当“失败重试”配置为“是”才显示“超时重试”。

当前节点失败后,后续节点处理策略

节点执行失败后的操作:

  • 终止当前作业执行计划:停止当前作业运行,当前作业实例状态显示为“失败”。
  • 继续执行下一节点:忽略当前节点失败,当前作业实例状态显示为“忽略失败”。
  • 挂起当前作业执行计划:暂停当前作业运行,当前作业实例状态显示为“等待运行”。
  • 终止后续节点执行计划:停止后续节点的运行,当前作业实例状态显示为“失败”。

是否空跑

如果勾选了空跑,该节点不会实际执行,将直接返回成功。