更新时间:2026-06-30 GMT+08:00
分享

配置分钟调度

该指导提供配置分钟调度的具体操作步骤。用户开发一个批处理的Pipeline作业,需要配置MRS Hive SQL节点参数,并按照分钟调度去运行该作业,并查看作业的运行日志。

准备工作

  • 已在管理中心创建通过代理连接方式的数据连接。数据连接名称为hive_000001。具体操作请参见MRS Hive数据连接参数说明
  • 已创建数据库。数据库名称为default。具体操作请参见新建数据库
  • 已创建Hive SQL脚本。脚本名称为hive_0520。具体操作请参见开发SQL脚本

操作步骤

  1. 在数据开发主界面的左侧导航栏,选择数据开发 > 作业开发
  2. 右键单击目录,选择“新建作业”。
  3. 创建一个批处理的Pipeline作业,作业名称为job_8750
  4. 作业基本参数设置完成后,单击“确定”,进入作业开发页面。
  5. MRS Hive SQL节点拖到画布中间,单击该节点名称,配置节点属性参数。

    重要配置参数如下:

    SQL脚本:选择已创建的脚本hive_0520

    脚本参数:可根据实际业务需要进行配置。如果SQL脚本中没有引用参数,此处脚本参数不显示。

    数据连接:选择已创建的数据连接hive_000001

    数据库:选择已创建的数据库default

  6. 单击右侧的“调度配置”,设置该作业的“调度方式”为“周期调度”,“调度周期”选择“分钟”进行调度。

    设置作业计划调度时间每天0点0分开始调度,每隔50分钟,作业调度一次,23点59分结束

    图1 配置分钟调度

    调度周期选择“分钟”时,系统不支持按照配置的时间间隔固定频率去运行,即不支持跨小时按照固定频率去运行。举例如下:

    • 2024年6月19日14点20分配置了分钟调度,开始时间为0时30分,间隔时间为30分钟,结束时间为23时59分,则实际作业运行时间周期为2024-06-19 14:30:00、2024-06-19 15:30:00、2024-06-19 16:30:00、2024-06-19 17:30:00、2024-06-18 18:30:00等。
    • 2024年6月19日14点20分配置了分钟调度,开始时间为0时0分,间隔时间为50分钟,结束时间为23时59分,则实际作业运行时间周期为2024-06-19 14:50:00、2024-06-19 15:00:00、2024-06-19 15:50:00、2024-06-19 16:00:00、2024-06-19 16:50:00、2024-06-19 17:00:00、2024-06-19 17:50:00等。

  7. 根据实际业务需要,可选择配置该作业的依赖关系,其他参数保持默认。
  8. 单击保存并提交作业版本。
  9. 单击“执行调度”,作业启动调度。
  10. 在左侧菜单栏,选择“运维调度 > 作业监控”,在“批作业监控”页签下查看作业运行结果。

相关文档

  • 创建数据连接:通过配置数据源信息,可以建立数据连接。DataArts Studio基于管理中心的数据连接对数据湖底座进行数据开发、治理、服务和运营。配置开发和生产环境的数据连接后,数据开发时脚本/作业中的开发环境数据连接通过发布流程后,将自动切换对应生产环境的数据连接。具体请参见创建DataArts Studio数据连接
  • 创建数据表:您可以通过可视化模式、DDL模式或SQL脚本方式新建数据表。(推荐)可视化模式:您可以直接在DataArts Studio数据开发模块通过No Code方式,新建数据表。具体请参见新建数据表
  • 配置作业节点参数:节点定义对数据执行的操作。数据开发模块提供数据集成、计算&分析、数据库操作、资源管理等类型的节点,您可以根据业务模型选择所需的节点。具体请参见节点参数配置
  • 周期调度依赖策略:数据开发当前支持两种调度依赖策略:传统周期调度依赖和自然周期调度依赖。具体参见周期调度依赖策略

相关文档