更新时间:2024-02-07 GMT+08:00

SQL作业管理

SQL作业包括在SQL作业编辑器窗口执行SQL语句,导入数据和导出数据等操作。

SQL作业管理主要包括如下功能:

作业管理页面

在总览页面单击“SQL作业”简介,或在左侧导航栏单击“作业管理”>“SQL作业”,可进入SQL作业管理页面。SQL作业管理页面显示所有SQL作业,作业数量较多时,系统分页显示,可根据需要跳转至指定页面。您可以查看任何状态下的作业。作业列表默认按创建时间降序排列,创建时间最近的作业显示在最前端。

表1 作业管理参数

参数

参数说明

队列

作业所属队列的名称。

执行引擎

SQL作业支持spark和Trino两种引擎。

  • spark:显示执行引擎为“spark”的作业。
  • trino:显示执行引擎为“trino”的作业。

用户名

执行该作业的用户名。

类型

作业的类型,包括如下。

  • IMPORT:导入数据到DLI的作业。
  • EXPORT:从DLI导出数据的作业。
  • DCL:包括传统DCL,以及队列权限相关的操作。
  • DDL:与传统DDL操作一致,即创建和删除数据库,创建和删除表的作业。
  • QUERY:执行SQL查询数据的作业。
  • INSERT:执行SQL插入数据的作业。
  • UPDATE:更新数据。
  • DELETE:删除SQL作业。
  • DATA_MIGRATION:数据迁移。
  • RESTART_QUEUE:重启队列。
  • SCALE_QUEUE: 队列规格变更(扩容/缩容)。

状态

作业的状态信息,包括如下。

  • 提交中
  • 运行中
  • 已成功
  • 已取消
  • 已失败
  • 规格变更中

执行语句

作业的具体SQL语句以及导出、建表的操作,此处展示操作的描述。

单击可复制对应的语句。

运行时长

作业的运行时长。

创建时间

每个作业的创建时间,可按创建时间顺序或倒序显示作业列表。

操作

  • 编辑:重新编辑修改该作业。
  • 终止:
    • 当作业状态在“提交中”“运行中”时,“终止”按钮才生效。
    • 当作业状态为“已成功”“已失败”“已取消”的作业不能终止。
    • “终止”按钮为灰色时,表示无法执行终止操作。
  • 重新执行:重新执行该作业。
  • SparkUI:单击后,将跳转至Spark任务运行情况界面。
    说明:
    • 新建队列,运行作业时会重新拉集群,大概需要10分钟左右才能拉好集群,在集群创建好之前单击SparkUI会导致缓存空的projectID,从而导致无法查看SparkUI。建议使用专属队列,集群不会被释放,就不会有该问题,或者提交作业后等一段时间再查看SparkUI,确保集群已经拉好了,不要立即单击SparkUI。
    • 目前DLI配置SparkUI只展示最新的100条作业信息。
  • QUERY作业和异步DDL作业除上述操作外,还包括:
    • 下载到本地:异步DDL和QUERY语句支持将结果下载到本地。具体操作请见下载到本地
    • 查看结果:查看作业运行结果。
    • 导出结果:将作业运行结果导出至用户创建的OBS桶中。
  • EXPORT作业除上述操作外,还包括:
    • 立即下载
  • 归档日志:将作业日志保存到系统创建的DLI临时OBS数据桶中。
说明:

default队列下运行的作业或者该作业为同步作业时不支持归档日志操作。

查找作业

“SQL作业”页面,可以通过以下方式对作业进行过滤筛选,在页面中显示符合对应条件的作业。

  • 选择队列名称
  • 选择执行引擎
  • 设置日期范围
  • 输入用户名/执行语句/作业ID/标签
  • 选择创建时间顺序/倒序排列
  • 选择作业类型
  • 选择作业状态
  • 选择运行时长顺序/倒序排列

查看作业详情

“SQL作业”页面,选中一条作业,单击该作业对应的,可查看该条作业的详细信息。

不同类型的作业,显示的作业详情不同。作业详情根据作业类型、状态和配置选项不同显示可能存在差异,具体以实际界面显示为准。以导入数据作业,建表作业和查询作业为例说明。其他作业类型支持查看的详细信息请以控制台信息为准。

  • 导入数据(load data)作业(作业类型:IMPORT),包括以下信息:队列,作业ID,用户名,类型,状态,执行语句,运行时长,创建时间,结束时间,参数设置,标签,结果条数,已扫描数据,扫描数据条数,错误记录条数,存储路径,数据格式,数据库,表,表头,分隔符,引用字符,转义字符,日期格式,时间戳格式,CPU累计使用量,输出字节。
  • 建表(create table)作业(作业类型:DDL),包括以下信息:队列,作业ID,用户名,类型,状态,执行语句,运行时长,创建时间,结束时间,参数设置,标签,结果条数,已扫描数据,数据库。
  • 查询(select)作业(作业类型:QUERY),包括以下信息:队列,作业ID,用户名,类型,状态,执行语句,运行时长,创建时间,结束时间,参数设置,标签,结果条数(运行成功,可导出结果),已扫描数据,执行用户,结果状态(运行成功,可查看结果;运行失败,显示失败原因),数据库,CPU累计使用量,输出字节。
    • CPU累计使用量:作业执行过程的CPU消耗总和,单位:Core*ms
    • 输出字节:作业执行完成后输出的字节数。

终止作业

“SQL作业”页面,可单击“操作”列的“终止”,终止“提交中”或“运行中”的作业。

下载到本地

异步DDL和QUERY语句支持将结果下载到本地。操作如下:

  1. 单击执行成功的异步DDL或QUERY语句“操作”列中的“下载到本地”,在提示窗口单击“确认”。此时,“操作”列中的“下载到本地”将变为“立即下载”。

  2. 单击“立即下载”将对应结果下载到本地。

导出查询结果

2024年1月后,DLI仅支持从作业桶读取查询结果,如需使用该特性需具备以下条件:
  • 在DLI管理控制台“全局配置 > 工程配置”中完成作业桶的配置。作业桶配置请参考工程配置
  • 提交工单申请开启查询结果写入桶特性的白名单。

下载OBS对象到本地请参考《对象存储用户指南》中“对象管理 > 下载”。