更新时间:2024-09-27 GMT+08:00

查看Flink作业详情

创建作业后,您可以在DLI管理控制台查看Flink作业的基本信息、作业详情、任务列表、执行计划等信息。

本节操作介绍怎样查看Flink作业相关信息。

表1 查看Flink作业相关信息

类型

说明

操作指导

Flink作业基本信息

包括Flink作业的ID、作业类型、作业执行状态等信息。

查看Flink作业基本信息

Flink作业详情

包括作业的SQL语句和参数设置信息,Jar作业支持查看参数设置信息。

查看Flink作业详情

Flink作业监控

通过云监控服务(CES)查看作业数据输入输出的详细信息。

查看Flink作业监控

Flink作业任务列表

查看作业运行时每个任务的详细信息,例如任务的开始时间、收发字节数和运行时长等。

查看Flink作业任务列表

Flink作业执行计划

了解运行中的作业的算子流向。

查看Flink作业执行计划

查看Flink作业基本信息

单击“作业管理 > Flink作业”,进入Flink作业管理页面。Flink作业管理页面显示所有的Flink作业,通过Flink作业列表可以了解Flink作业的基本信息。

表2 Flink作业基本信息

参数

参数说明

ID

所提交Flink作业的ID,由系统默认生成。

名称

所提交Flink作业的名称。

类型

所提交Flink作业的类型。包括:

  • Flink SQL:Flink SQL作业
  • Flink Jar:Flink Jar作业
  • Flink OpenSource SQL:Flink OpenSource SQL作业

状态

作业的状态信息。具体状态信息以控制台为准。

描述

所提交Flink作业的描述。

用户名

提交作业的用户名称。

创建时间

每个作业的创建时间。

开始时间

Flink作业开始运行的时间。

运行时长

作业运行所消耗的时间。

操作

  • 编辑:编辑已经创建好的作业。
  • 启动:启动作业并运行。
  • 更多
    • FlinkUI:单击后,将跳转至Flink任务运行情况界面。
      说明:

      如果是新建队列,在该队列提交作业后,如果立即单击FlinkUI,因为后台大约需要10分钟创建集群,会导致缓存空的projectID,从而导致无法查看FlinkUI。

      建议作业选择使用专属队列,后台集群不会被释放,避免上述问题产生。或者等待作业运行中时再查看FlinkUI,确保集群已经拉好了,不要立即单击FlinkUI。

    • 停止:停止Flink作业。如果该功能置灰,表示当前状态的作业不支持停止。
    • 删除:删除作业。
      说明:

      作业删除后不可恢复,请谨慎操作。

    • 名称和描述修改:修改作业名称和描述。
    • 导入保存点:导入原实时流计算服务作业导出的数据。
    • 触发保存点:“运行中”的作业可以“触发保存点”,保存作业的状态信息。
    • 权限管理:查看作业对应的用户权限信息以及对其他用户授权。
    • 运行时配置:支持作业在运行时配置作业异常告警和异常自动重启。

查看Flink作业详情

用户作业创建完成并保存后,用户可以单击作业名查看作业的详细信息,包括作业的SQL语句和参数设置信息,如果是 jar作业只可以看到参数设置信息。

  1. 在DLI管理控制台的左侧导航栏中,单击作业管理>Flink作业,进入Flink作业管理页面。
  2. 单击需要查看的作业名称,进入“作业详情”页面。

    “作业详情”页签,用户可以查看作业的SQL语句、参数设置信息和总费用。

    以某个Flink SQL作业为例进行说明。
    表3 参数说明

    参数名称

    参数说明

    类型

    作业类型,如Flink SQL作业。

    名称

    Flink作业名称。

    描述

    Flink作业描述信息。

    状态

    Flink作业运行状态。

    运行模式

    默认独享模式。

    Flink 版本

    作业所选的Flink作业的版本。

    所属队列

    Flink作业所属的队列名称。

    UDF Jar

    配置UDF Jar参数时显示。

    优化参数

    作业添加了自定义参数配置时显示该参数。

    CU数量

    作业配置的CU数量。

    管理单元

    作业配置的管理单元CU数量。

    并行数

    作业配置的同时运行Flink作业的任务数。

    单TM所占CU数

    作业配置的每个TaskManager所占CU数量。

    单TM Slot数

    作业配置的每个TaskManager Slot数量。

    OBS桶

    作业配置了OBS桶显示。当勾选“开启Checkpoint”“保存作业日志”参数后,用于保存Checkpoint和作业运行日志。

    保存作业日志

    开启或关闭。

    作业异常告警

    开启或关闭。

    SMN主题

    作业配置的SMN主题名称。当作业勾选了“作业异常告警”参数时显示。

    异常自动重启

    开启或关闭。

    异常重试最大次数

    异常重试最大次数为无限时显示为“无限”,其余为设置的具体值。

    从Checkpoint恢复

    开启或关闭。

    ID

    作业ID。

    保存点路径

    保存点的OBS存储路径。

    开启Checkpoint

    开启或关闭。

    Checkpoint间隔

    将作业运行的中间结果保存到OBS的间隔时间,单位为秒。

    Checkpoint模式

    Checkpoint 模式:

    • at_least_once:事件至少被处理一次
    • exactly_once:事件仅被处理一次

    空闲状态保留时长

    用于清除GroupBy、RegularJoin、Rank、Depulicate等算子经过最大保留时间后仍未更新的中间状态,默认设置为1小时。

    脏数据策略

    作业出现脏数据时的处理策略。作业配置脏数据策略时显示该参数。

    忽略。

    抛出异常。

    保存。

    脏数据转储地址

    “脏数据策略”选择“保存”时,保存脏数据的OBS路径。

    创建时间

    作业创建的具体时间。

    更新时间

    作业最近一次更新的时间。

查看Flink作业监控

用户可以通过云监控服务(CES)查看作业数据输入输出的详细信息。

  1. 在DLI管理控制台的左侧导航栏中,单击作业管理>Flink作业,进入Flink作业管理页面。
  2. 单击需要查看的作业名称,进入“作业详情”页面。

    单击页面右上角的作业监控,将跳转至云监控服务(CES)。
    图1 作业监控

    Flink 作业包含如下监控指标。

    表4 Flink作业监控指标

    指标名称

    说明

    Flink作业数据输入速率

    展示用户Flink作业的数据输入速率,供监控和调试使用。单位:条/秒。

    Flink作业数据输出速率

    展示用户Flink作业的数据输出速率,供监控和调试使用。单位:条/秒。

    Flink作业数据输入总数

    展示用户Flink作业的数据输入总数,供监控和调试使用。单位:条。

    Flink作业数据输出总数

    展示用户Flink作业的数据输出总数,供监控和调试使用。单位:条。

    Flink作业字节输入速率

    展示用户Flink作业每秒输入的字节数。单位:字节/秒。

    Flink作业字节输出速率

    展示用户Flink作业每秒输出的字节数。单位:字节/秒。

    Flink作业字节输入总数

    展示用户Flink作业字节的输入总数。单位:字节。

    Flink作业字节输出总数

    展示用户Flink作业字节的输出总数。单位:字节。

    Flink作业CPU使用率

    展示用户Flink作业的CPU使用率。单位:%。

    Flink作业内存使用率

    展示用户Flink作业的内存使用率。单位:%。

    Flink作业最大算子延迟

    展示用户Flink作业的最大算子延迟时间,单位ms。

    Flink作业最大算子反压

    展示用户Flink作业的最大算子反压值,数值越大,反压越严重。

    0:表示OK

    50:表示Low

    100:表示High

查看Flink作业任务列表

用户可以查看作业运行时每个任务的详细信息,例如任务的开始时间、收发字节数和运行时长等。

如果数据为零,表示没有从数据源接收到数据。

  1. 在DLI管理控制台的左侧导航栏中,单击作业管理>Flink作业,进入Flink作业管理页面。
  2. 单击需要查看的作业名称,进入“作业详情”页面。
  3. “任务列表”页签,可以查看任务的节点信息。

    图2 任务列表
    查看算子任务列表,具体参见下表:
    表5 算子任务列表参数

    参数

    说明

    名称

    算子名称。

    持续时间

    算子运行的持续时间。

    最大并行数

    算子中并行的Task的个数。

    任务

    算子的任务有以下几种:

    • 红色数字表示已失败的Task个数。
    • 浅灰色数字表示已取消的Task个数。
    • 黄色数字表示取消中的Task个数。
    • 绿色数字表示已完成的Task个数。
    • 蓝色数字表示运行中的Task个数。
    • 天蓝色数字表示部署中的Task个数。
    • 深灰色数字表示排队中的Task个数。

    状态

    算子任务对应的状态。

    反压状态

    算子的工作负荷状态。包含如下几种状态:

    • OK:表示工作负荷正常。
    • LOW:表示工作负荷略高。DLI处理数据的速度比较快。
    • HIGH:表示工作负荷高。源端输入数据的速度比较慢。

    时延

    指事件从源端算子到达本算子的过程中消耗的时间,单位为毫秒(ms)。

    发送的记录数

    算子发送数据的记录。

    发送的字节数

    算子发送的字节数。

    接受的字节数

    算子接收的字节数。

    接受的记录数

    算子收到数据的记录。

    开始时间

    算子运行开始时间。

    结束时间

    算子运行结束时间。

查看Flink作业执行计划

用户通过查看执行计划了解到运行中的作业的算子流向。

  1. 在DLI管理控制台的左侧导航栏中,单击作业管理>Flink作业,进入Flink作业管理页面。
  2. 单击需要查看的作业名称,进入“作业详情”页面。
  3. 单击“执行计划”,在“执行计划”页签可以查看作业的算子流向。

    图3 执行计划
    单击对应的节点,在页面右侧显示对应的信息。
    • 滚动鼠标滚轮可对流图进行缩放查看。
    • 流图展示当前运行作业的实时算子流图信息。