更新时间:2022-07-01 GMT+08:00

SQL作业管理

SQL作业包括在SQL作业编辑器窗口执行SQL语句,导入数据和导出数据等操作。

SQL作业管理主要包括如下功能:

以及查看“使用指南”和“使用视频”。

作业管理页面

在总览页面单击“SQL作业”简介,或在左侧导航栏单击“作业管理”>“SQL作业”,可进入SQL作业管理页面。SQL作业管理页面显示所有SQL作业,作业数量较多时,系统分页显示,可根据需要跳转至指定页面。您可以查看任何状态下的作业。作业列表默认按创建时间降序排列,创建时间最近的作业显示在最前端。

表1 作业管理参数

参数

参数说明

队列名称

作业所属队列的名称。

执行引擎

SQL作业支持spark和openLookeng(基于Apache Presto)两种引擎。

  • spark:显示执行引擎为“spark”的作业。
  • openLookeng:显示执行引擎为“openLooKeng”的作业。

创建时间

每个作业的创建时间,可按创建时间顺序或倒序显示作业列表。

作业类型

作业的类型,包括如下。

  • IMPORT:导入数据到DLI的作业。
  • EXPORT:从DLI导出数据的作业。
  • DCL:包括传统DCL,以及队列权限相关的操作。
  • DDL:与传统DDL操作一致,即创建和删除数据库,创建和删除表的作业。
  • QUERY:执行SQL查询数据的作业。
  • INSERT:执行SQL插入数据的作业。
  • UPDATE:更新数据。
  • DELETE:删除SQL作业。
  • DATA_MIGRATION:数据迁移。
  • RESTART_QUEUE:重启队列。
  • SCALE_QUEUE: 队列规格变更(扩容/缩容)。

状态

作业的状态信息,包括如下。

  • 运行中
  • 规格变更中
  • 提交中
  • 已取消
  • 已成功
  • 已失败

执行语句

作业的具体SQL语句以及导出、建表的操作,此处展示操作的描述。

单击可复制对应的语句。

运行时长

作业的运行时长。

操作

  • 终止:
    • 当作业状态在“提交中”“运行中”时,“终止”按钮才生效。
    • 当作业状态为“已成功”“已失败”“已取消”的作业不能终止。
    • “终止”按钮为灰色时,表示无法执行终止操作。
  • SparkUI:单击后,将跳转至Spark任务运行情况界面。
  • QUERY作业和异步DDL作业除上述操作外,还包括:
    • 查看结果:查看作业运行结果。
    • 导出结果:将作业运行结果导出至用户创建的OBS桶中。具体操作请见导出查询结果
  • EXPORT作业除上述操作外,还包括:
    • 立即下载
  • 归档日志:将作业日志保存到系统创建的DLI临时OBS数据桶中。
  • 导出日志:将日志导出至用户创建的OBS桶中进行查看。当作业状态在“运行中”时,不能导出日志。
    说明:

    用户需要具有创建OBS桶的权限。

查找作业

“SQL作业”页面,可以通过以下方式对作业进行过滤筛选,在页面中显示符合对应条件的作业。

  • 选择队列名称
  • 设置日期范围
  • 输入执行语句/作业ID
  • 选择创建时间顺序/倒序排列
  • 选择作业类型
  • 选择作业状态
  • 选择运行时长顺序/倒序排列

查看作业详情

“SQL作业”页面,选中一条作业,单击该作业对应的,可查看该条作业的详细信息。

不同类型的作业,显示的作业详情不同。以导入数据作业,建表作业和查询作业为例说明。

  • 导入数据(load data)作业(作业类型:IMPORT),包括以下信息:队列名称,作业ID,创建时间,作业类型,作业状态,执行语句,运行时长,已扫描数据,执行用户,结果条数,扫描数据条数,错误记录条数,数据库名称,表名,文件格式,表头,引用字符,分隔符,数据源路径,转义字符,导入开始时间,导入结束时间,日期格式,时间戳格式。
  • 建表(create table)作业(作业类型:DDL),包括以下信息:队列名称,作业ID,创建时间,作业类型,作业状态,执行语句,运行时长,已扫描数据,执行用户。
  • 查询(select)作业(作业类型:QUERY),包括以下信息:队列名称,作业ID,创建时间,作业类型,作业状态,执行语句,运行时长,结果条数(运行成功,可导出结果),已扫描数据,执行用户,结果状态(运行成功,可查看结果;运行失败,显示失败原因)。

终止作业

“SQL作业”页面,可单击“操作”列的“终止”,终止“提交中”或“运行中”的作业。

导出查询结果

导出查询结果的操作入口有两个,分别在“SQL作业”“SQL编辑器”页面。

  • 在“作业管理”>“SQL作业”页面,可单击对应作业“操作”列“更多”中的“导出结果”,可导出执行查询后的结果。
  • “SQL编辑器”页面,查询语句执行成功后,在“查看结果”页签右侧,单击“导出结果”,可导出执行查询后的结果。

若查询结果中无数值列,则无法导出查询结果。

表2 参数说明

参数名称

描述

数据源格式

导出查询结果数据的文件格式。当前只支持json格式。

队列

选择队列。

压缩格式

导出查询结果数据的压缩方式,选择如下压缩方式。

  • none
  • bzip2
  • deflate
  • gzip

存储路径

输入或选择OBS的路径。

说明:
  • 选择OBS桶后,请在文本框中定义文件夹名称,若该文件夹不存在,则会在OBS中创建。
  • 文件夹名称不能包含下列特殊字符:\ / : * ? " < > |,并且不能以“.”开头和结尾。

导出方式

导出查询结果数据的保存方式。

  • 随导出创建指定路径:指定的导出目录必须不存在,如果指定目录已经存在,系统将返回错误信息,无法执行导出操作。
  • 覆盖指定路径:在指定目录下新建文件,会删除已有文件。

结果条数

导出查询结果数据的数量。不填写数值或数值为“0”时,导出全部结果。

高级选项

表头:无/有

设置导出查询结果数据是否含表头。当“导出格式”“json”时该参数有效。当前只支持json格式。

选中“高级选项”,勾选“表头:无”前的方框,“表头:无”显示为“表头:有”,表示有表头;去勾选即为“表头:无”,表示无表头。