更新时间:2024-10-18 GMT+08:00

新建实时处理集成作业

前提条件

作业在每个工作空间的最大配额为10000,请确保当前作业的数量未达到最大配额。

操作步骤

  1. 参考访问DataArts Studio实例控制台,登录DataArts Studio管理控制台。
  2. DataArts Studio控制台首页,选择对应工作空间的“数据开发”模块,进入数据开发页面。
  3. 在数据开发主界面的左侧导航栏,选择数据开发 > 作业开发
  4. 新建集成作业的方式有如下两种:

    方式一:在“作业开发”界面中,单击“新建集成作业”。

    图1 新建集成作业(方式一)

    方式二:在作业目录中,右键单击目录名称,选择“新建集成作业”

    图2 新建集成作业(方式二)
  5. 在弹出的“新建集成作业”页面,配置如表1所示的参数。
    表1 作业参数

    参数

    说明

    作业名称

    自定义作业的名称,只能包含英文字母、数字、中文、“-”“_”“.”,且长度为1~128个字符。

    作业类型

    选择作业的类型,须选择实时处理。

    • 离线处理:对已收集的大量数据进行批量处理和分析,这些任务通常是在计算资源和存储资源方面经过优化,以确保高效的数据处理和分析。这些任务通常是定时(例如每天、每周)执行,主要处理大量历史数据,用于批量分析和数据仓库。
    • 实时处理:对源源不断产生的新数据进行实时处理和分析,以满足业务对数据的即时性需求。这种处理方式要求数据在产生后能够立即被处理,并给出相应的结果或触发相应的操作。

    选择目录

    选择作业所属的目录,默认为根目录。

  6. 单击“确定”,创建作业。