更新时间:2023-06-14 GMT+08:00
新建作业
作业由一个或多个节点组成,共同执行以完成对数据的一系列操作。开发作业前请先新建作业。
前提条件
作业在每工作空间的最大配额为10000,请确保当前作业的数量未达到最大配额。
新建目录(可选)
如果已存在可用的目录,可以不用新建目录。
- 登录DataArts Studio控制台。选择实例,点击“进入控制台”,选择对应工作空间的“数据开发”模块,进入数据开发页面。
图1 选择数据开发
- 在数据开发主界面的左侧导航栏,选择 。
- 在作业目录中,右键单击目录名称,选择“新建目录”。
- 在弹出的“新建目录”页面,配置如表1所示的参数。
- 单击“确定”,新建目录。
新建作业
默认作业的最大配额是10000,请确保当前作业的数量未达到最大配额。
- 登录DataArts Studio控制台。选择实例,点击“进入控制台”,选择对应工作空间的“数据开发”模块,进入数据开发页面。
图2 选择数据开发
- 在数据开发主界面的左侧导航栏,选择 。
- 新建作业的方式有如下两种:
图3 新建作业(方式一)
方式二:在作业目录中,右键单击目录名称,选择“新建作业”。
图4 新建作业(方式二)
- 在弹出的“新建作业”页面,配置如表2所示的参数。
表2 作业参数 参数
说明
作业名称
自定义作业的名称,只能包含英文字母、数字、中文、“-”、“_”、“.”,且长度为1~128个字符。
作业类型
选择作业的类型。
- 批处理作业:按调度计划定期处理批量数据,主要用于实时性要求低的场景。批作业是由一个或多个节点组成的流水线,以流水线作为一个整体被调度。被调度触发后,任务执行一段时间必须结束,即任务不能无限时间持续运行。
批处理作业可以配置作业级别的调度任务,即以作业为一整体进行调度,具体请参见配置作业调度任务(批处理作业)。
- 实时处理作业:处理实时的连续数据,主要用于实时性要求高的场景。实时作业是由一个或多个节点组成的业务关系,每个节点可单独被配置调度策略,而且节点启动的任务可以永不下线。在实时作业里,带箭头的连线仅代表业务上的关系,而非任务执行流程,更不是数据流。
实时处理作业可以配置节点级别的调度任务,即每一个节点可以独立调度,具体请参见配置节点调度任务(实时作业)。
创建方式
选择作业的创建方式。
- 创建空作业:创建一个空的作业。
- 基于模板创建:使用数据开发模块提供的模板来创建。
选择目录
选择作业所属的目录,默认为根目录。
责任人
填写该作业的责任人。
作业优先级
选择作业的优先级,提供高、中、低三个等级。
委托配置
配置委托后,作业执行过程中,以委托的身份与其他服务交互。若该工作空间已配置过委托,参见配置工作空间级委托,则新建的作业默认使用该工作空间级委托。您也可参见配置作业级委托,修改为作业级委托。
说明:作业级委托优先于工作空间级委托。
日志路径
选择作业日志的OBS存储路径。日志默认存储在以dlf-log-{Projectid}命名的桶中。
说明:- 若您想自定义存储路径,请参见(可选)修改作业日志存储路径选择您已在OBS服务侧创建的桶。
- 请确保您已具备该参数所指定的OBS路径的读、写权限,否则系统将无法正常写日志或显示日志。
- 批处理作业:按调度计划定期处理批量数据,主要用于实时性要求低的场景。批作业是由一个或多个节点组成的流水线,以流水线作为一个整体被调度。被调度触发后,任务执行一段时间必须结束,即任务不能无限时间持续运行。
- 单击“确定”,创建作业。
父主题: 作业开发