更新时间:2024-10-10 GMT+08:00
分享

运维概览

运维调度 > 运维概览页面,用户可以通过图表的形式查看作业实例的统计数据,目前支持查看以下七种统计数据。

  • 运行状态
    • 通过时间和责任人可以筛选出今天我的或者全部责任人的作业实例调度运行状态概览
    • 通过时间和责任人可以筛选出昨天我的或者全部责任人的作业实例调度运行状态概览
    • 通过时间和责任人可以筛选出前天我的或者全部责任人的作业实例调度运行状态概览
    • 通过时间和责任人可以筛选出近七天我的或者全部责任人的作业实例调度运行状态概览
    • 单击运行状态,可以跳转到实例监控界面,查看该运行状态的所有作业的详细信息。
      • 此处的统计数据包含实时作业的运行实例监控数据。单击运行状态后,实时作业不能跳转到实例监控页面,只能查看批作业的运行实例监控详情。
      • 系统默认查看今天全部责任人的作业实例调度运行状态概览。
      • 支持查看通过条件筛选出来的实例总数,以及运行成功的实例总数及运行成功百分比。
        图1 运行状态
  • 任务完成情况

    只统计运行成功的实例,每小时统计一次今天的数据,任务表示作业中的算子。

    • 支持查看昨天/今天/7天历史平均的运行成功的作业的全部节点算子的任务完成情况的曲线图。
    • 支持查看昨天/今天/7天历史平均的运行成功的作业的不同类型节点算子的任务完成情况的曲线图。
  • 基线看板
    • 可以查看基线破线的数据。支持查看今日破线的基线实例数量。当到达基线承诺时间时,基线上任务仍处于未完成状态时,基线将处于破线状态。
    • 可以查看基线预警的数据。支持查看今日预警的基线实例数量。当预测到基线上任务无法在基线承诺时间内完成时,将触发基线预警。
    • 可以查看出错事件的数据。支持查看今日出错的事件数量。基线监控范围内的任务,即影响基线数据产出的任务执行出错将会产生出错事件。
    • 可以查看变慢事件的数据。支持查看今日变慢的事件数量。基线监控范围内的任务,即影响基线数据产出的任务,其运行时间相比过去一段时间内的平均运行时间明显变长时,将产生任务变慢事件。
  • 任务数统计

    统计5分钟内启动执行的算子实例数,任务表示作业中的算子,可查看30天内的数据。

    • 可以通过时间进行筛选,查看30天以内的每一天的启动执行的算子实例数据。
    • 支持查看启动作业执行的全部节点算子实例数的曲线图。
    • 支持查看启动作业执行的不同类型节点算子实例数的曲线图。
  • DLI运行作业数/队列CU使用量

    支持通过DLI队列时间筛选查看DLI运行作业数和队列CU使用量。

    • 系统默认支持查看七天内的数据。最多可查看一个月的数据。
    • 仅支持查看非默认队列的数据。单击队列名称,可以将某个队列进行置顶。
  • 作业数/任务日调度数

    统计较长周期总作业数量与日调度任务数量的变化趋势,任务表示作业中的算子。

    作业数:所有批处理作业和实时作业的总数。

    任务日调度数:按照当天调度成功的节点进行统计,不区分实时任务和离线任务。

    • 系统默认查看一个月内的任务日调度数和作业数,支持通过时间段筛选进行查看。
  • 任务类型分布

    可以直观地查看作业的任务节点类型分布图及数量。

    任务表示作业中的算子。

    系统会统计已提交的所有作业节点数,含实时作业和批处理作业。

  • 实例运行时长top100
    • 通过时间和责任人筛选出我的或者全部责任人的实例运行时长top100的数据。
    • 单击作业名称,可以跳转到实例监控界面,查看作业运行的详细信息。
    • 系统默认展示一个月的批处理作业实例运行时长数据。
  • 实例运行失败top100
    • 通过时间和责任人筛选出我的或者全部责任人的实例运行失败top100的数据。
    • 单击作业名称,可以跳转到实例监控界面,查看作业运行的详细信息,查看作业实例运行失败的详细日志并分析原因。
    • 系统默认展示一个月的批处理作业实例运行数据。
  • 未来一周调度结束情况

    可以查看未来一周的作业调度结束的数据,包含作业名称、调度结束时间以及责任人。

    • 调度结束时间小于或等于2天,显示为红色。
    • 调度结束时间在3~5天,显示为橙色。
    • 调度结束时间在6~7天,显示为黑色。

相关文档