更新时间:2026-06-30 GMT+08:00
配置分钟调度
该指导提供配置分钟调度的具体操作步骤。用户开发一个批处理的Pipeline作业,需要配置MRS Hive SQL节点参数,并按照分钟调度去运行该作业,并查看作业的运行日志。
准备工作
- 已在管理中心创建通过代理连接方式的数据连接。数据连接名称为hive_000001。具体操作请参见MRS Hive数据连接参数说明。
- 已创建数据库。数据库名称为default。具体操作请参见新建数据库。
- 已创建Hive SQL脚本。脚本名称为hive_0520。具体操作请参见开发SQL脚本。
操作步骤
- 在数据开发主界面的左侧导航栏,选择。
- 右键单击目录,选择“新建作业”。
- 创建一个批处理的Pipeline作业,作业名称为job_8750。
- 作业基本参数设置完成后,单击“确定”,进入作业开发页面。
- 将MRS Hive SQL节点拖到画布中间,单击该节点名称,配置节点属性参数。
重要配置参数如下:
SQL脚本:选择已创建的脚本hive_0520
脚本参数:可根据实际业务需要进行配置。如果SQL脚本中没有引用参数,此处脚本参数不显示。
数据连接:选择已创建的数据连接hive_000001
数据库:选择已创建的数据库default
- 单击右侧的“调度配置”,设置该作业的“调度方式”为“周期调度”,“调度周期”选择“分钟”进行调度。
设置作业计划调度时间每天0点0分开始调度,每隔50分钟,作业调度一次,23点59分结束。
图1 配置分钟调度
调度周期选择“分钟”时,系统不支持按照配置的时间间隔固定频率去运行,即不支持跨小时按照固定频率去运行。举例如下:
- 2024年6月19日14点20分配置了分钟调度,开始时间为0时30分,间隔时间为30分钟,结束时间为23时59分,则实际作业运行时间周期为2024-06-19 14:30:00、2024-06-19 15:30:00、2024-06-19 16:30:00、2024-06-19 17:30:00、2024-06-18 18:30:00等。
- 2024年6月19日14点20分配置了分钟调度,开始时间为0时0分,间隔时间为50分钟,结束时间为23时59分,则实际作业运行时间周期为2024-06-19 14:50:00、2024-06-19 15:00:00、2024-06-19 15:50:00、2024-06-19 16:00:00、2024-06-19 16:50:00、2024-06-19 17:00:00、2024-06-19 17:50:00等。
- 根据实际业务需要,可选择配置该作业的依赖关系,其他参数保持默认。
- 单击保存并提交作业版本。
- 单击“执行调度”,作业启动调度。
- 在左侧菜单栏,选择“运维调度 > 作业监控”,在“批作业监控”页签下查看作业运行结果。
相关文档
- 创建数据连接:通过配置数据源信息,可以建立数据连接。DataArts Studio基于管理中心的数据连接对数据湖底座进行数据开发、治理、服务和运营。配置开发和生产环境的数据连接后,数据开发时脚本/作业中的开发环境数据连接通过发布流程后,将自动切换对应生产环境的数据连接。具体请参见创建DataArts Studio数据连接。
- 创建数据表:您可以通过可视化模式、DDL模式或SQL脚本方式新建数据表。(推荐)可视化模式:您可以直接在DataArts Studio数据开发模块通过No Code方式,新建数据表。具体请参见新建数据表。
- 配置作业节点参数:节点定义对数据执行的操作。数据开发模块提供数据集成、计算&分析、数据库操作、资源管理等类型的节点,您可以根据业务模型选择所需的节点。具体请参见节点参数配置
- 周期调度依赖策略:数据开发当前支持两种调度依赖策略:传统周期调度依赖和自然周期调度依赖。具体参见周期调度依赖策略。