计算
弹性云服务器 ECS
Flexus云服务
裸金属服务器 BMS
弹性伸缩 AS
镜像服务 IMS
专属主机 DeH
函数工作流 FunctionGraph
云手机服务器 CPH
Huawei Cloud EulerOS
网络
虚拟私有云 VPC
弹性公网IP EIP
虚拟专用网络 VPN
弹性负载均衡 ELB
NAT网关 NAT
云专线 DC
VPC终端节点 VPCEP
云连接 CC
企业路由器 ER
企业交换机 ESW
全球加速 GA
安全与合规
安全技术与应用
Web应用防火墙 WAF
企业主机安全 HSS
云防火墙 CFW
安全云脑 SecMaster
DDoS防护 AAD
数据加密服务 DEW
数据库安全服务 DBSS
云堡垒机 CBH
数据安全中心 DSC
云证书管理服务 CCM
边缘安全 EdgeSec
态势感知 SA
威胁检测服务 MTD
CDN与智能边缘
内容分发网络 CDN
CloudPond云服务
智能边缘云 IEC
迁移
主机迁移服务 SMS
对象存储迁移服务 OMS
云数据迁移 CDM
迁移中心 MGC
大数据
MapReduce服务 MRS
数据湖探索 DLI
表格存储服务 CloudTable
云搜索服务 CSS
数据接入服务 DIS
数据仓库服务 GaussDB(DWS)
数据治理中心 DataArts Studio
数据可视化 DLV
数据湖工厂 DLF
湖仓构建 LakeFormation
企业应用
云桌面 Workspace
应用与数据集成平台 ROMA Connect
云解析服务 DNS
专属云
专属计算集群 DCC
IoT物联网
IoT物联网
设备接入 IoTDA
智能边缘平台 IEF
用户服务
账号中心
费用中心
成本中心
资源中心
企业管理
工单管理
国际站常见问题
ICP备案
我的凭证
支持计划
客户运营能力
合作伙伴支持计划
专业服务
区块链
区块链服务 BCS
Web3节点引擎服务 NES
解决方案
SAP
高性能计算 HPC
视频
视频直播 Live
视频点播 VOD
媒体处理 MPC
实时音视频 SparkRTC
数字内容生产线 MetaStudio
存储
对象存储服务 OBS
云硬盘 EVS
云备份 CBR
存储容灾服务 SDRS
高性能弹性文件服务 SFS Turbo
弹性文件服务 SFS
云硬盘备份 VBS
云服务器备份 CSBS
数据快递服务 DES
专属分布式存储服务 DSS
容器
云容器引擎 CCE
容器镜像服务 SWR
应用服务网格 ASM
华为云UCS
云容器实例 CCI
管理与监管
云监控服务 CES
统一身份认证服务 IAM
资源编排服务 RFS
云审计服务 CTS
标签管理服务 TMS
云日志服务 LTS
配置审计 Config
资源访问管理 RAM
消息通知服务 SMN
应用运维管理 AOM
应用性能管理 APM
组织 Organizations
优化顾问 OA
IAM 身份中心
云运维中心 COC
资源治理中心 RGC
应用身份管理服务 OneAccess
数据库
云数据库 RDS
文档数据库服务 DDS
数据管理服务 DAS
数据复制服务 DRS
云数据库 GeminiDB
云数据库 GaussDB
分布式数据库中间件 DDM
数据库和应用迁移 UGO
云数据库 TaurusDB
人工智能
人脸识别服务 FRS
图引擎服务 GES
图像识别 Image
内容审核 Moderation
文字识别 OCR
AI开发平台ModelArts
图像搜索 ImageSearch
对话机器人服务 CBS
华为HiLens
视频智能分析服务 VIAS
语音交互服务 SIS
应用中间件
分布式缓存服务 DCS
API网关 APIG
微服务引擎 CSE
分布式消息服务Kafka版
分布式消息服务RabbitMQ版
分布式消息服务RocketMQ版
多活高可用服务 MAS
事件网格 EG
企业协同
华为云会议 Meeting
云通信
消息&短信 MSGSMS
云生态
合作伙伴中心
云商店
开发者工具
SDK开发指南
API签名指南
Terraform
华为云命令行工具服务 KooCLI
其他
产品价格详情
系统权限
管理控制台
客户关联华为云合作伙伴须知
消息中心
公共问题
开发与运维
应用管理与运维平台 ServiceStage
软件开发生产线 CodeArts
需求管理 CodeArts Req
部署 CodeArts Deploy
性能测试 CodeArts PerfTest
编译构建 CodeArts Build
流水线 CodeArts Pipeline
制品仓库 CodeArts Artifact
测试计划 CodeArts TestPlan
代码检查 CodeArts Check
代码托管 CodeArts Repo
云应用引擎 CAE
开天aPaaS
云消息服务 KooMessage
云手机服务 KooPhone
云空间服务 KooDrive

IF条件判断教程

更新时间:2022-08-17 GMT+08:00

当您在数据开发模块进行作业开发编排时,想要实现通过设置条件,选择不同的执行路径,可使用IF条件判断。

本教程包含以下三个常见场景举例。

IF条件的数据来源于EL表达式,通过EL表达式,根据具体的场景选择不同的EL表达式来达到目的。您可以参考本教程,根据您的实际业务需要,开发您自己的作业。

EL表达式用法可参考EL表达式概述

根据前一个节点的执行状态进行IF条件判断

场景说明

根据前一个CDM节点是否执行成功,决定执行哪一个IF条件分支。基于图1的样例,说明如何设置IF条件。

图1 作业样例

配置方法

  1. 登录DataArts Studio控制台,找到所需要的DataArts Studio实例,单击实例卡片上的“进入控制台”,进入概览页面。
  2. 选择“空间管理”页签,在工作空间列表中,找到所需要的工作空间,单击工作空间的“数据开发”,系统跳转至数据开发页面。
  3. 在“作业开发”页面,新建数据开发作业,然后分别选择CDM节点和两个Dummy节点,选中连线图标并拖动,编排图1所示的作业。其中CDM节点的失败策略需要设置为“继续执行下一节点”
  4. 右键单击连线,选择“设置条件”,在弹出的“编辑EL表达式”文本框中输入IF条件。

    每一个条件分支都需要填写IF条件,IF条件为通过EL表达式语法填写三元表达式。当三元表达式结果为true的时候,才会执行连线后面的节点,否则后续节点将被跳过

    此Demo中使用的EL表达式为“#{Job.getNodeStatus("node_name")}”,这个表达式的作用为获取指定节点的执行状态,成功状态返回success,失败状态返回fail。本例使用中,IF条件表达式分别为:

    • 上面的A分支IF条件表达式为: #{(Job.getNodeStatus("CDM")) == "success" ? "true" : "false"}
    • 下面的B分支IF条件表达式为:#{(Job.getNodeStatus("CDM")) == "fail" ? "true" : "false"}
    输入IF条件表达式后,配置IF条件匹配失败策略,可选择仅跳过相邻的下一个节点,或者跳过该IF分支后续所有节点。配置完成后点击确定,保存作业。
    图2 配置失败策略

  5. 测试运行作业,并前往实例监控中查看执行结果。
  6. 待作业运行完成后,从实例监控中查看作业实例的运行结果,如图3所示。可以看到运行结果是符合预期的,当前CDM执行的结果为fail的时候,跳过A分支,执行B分支。

    图3 作业运行结果

根据前一个节点的输出结果进行IF条件判断

场景说明

目标场景:将HIVE SQL节点的Select语句执行结果,作为参数传递到下一个节点进行条件判断,然后决定执行哪一个IF条件分支

场景分析:由于HIVE SQL节点的Select语句执行结果为二维数组,要获取二维数组中的值,我们需要用到#{Loop.dataArray[][]}这个EL表达式,而当前只有For Each节点支持该表达式,所以HIVE SQL节点后面需要连接一个For Each节点,作业编排如图4所示:

图4 主作业样例

其中,For Each节点的关键配置如下:

  • 数据集:数据集就是HIVE SQL节点的Select语句的执行结果。使用EL表达式#{Job.getNodeOutput('HIVE')}其中HIVE为前一个节点的名称。
  • 作业运行参数:作业运行参数是子作业中定义的参数,可以将主作业前一个节点的输出,传递到子作业以供使用。此处变量名为result,其值为数据集中的某一列,使用EL表达式#{Loop.dataArray[0][0]}

而For Each节点中所选的子作业,需要根据For Each节点传过来的作业运行参数,决定执行For Each中子作业的哪一个IF条件分支作业编排图5所示。

图5 子作业样例

其中,子作业的关键配置为IF条件设置,本例使用表达式${result}获取作业参数的值。

说明:

此处不能使用EL表达式#{Job.getParam("job_param_name")} ,因为此表达式只能直接获取当前作业里配置的参数的value,并不能获取到父作业传递过来的参数值,也不能获取到工作空间里面配置的全局变量,作用域仅为本作业。

而表达式${job_param_name},既可以获取到父作业传递过来的参数值,也可以获取到全局配置的变量。

配置方法

开发子作业

  1. 登录DataArts Studio控制台,找到所需要的DataArts Studio实例,单击实例卡片上的“进入控制台”,进入概览页面。
  2. 选择“空间管理”页签,在工作空间列表中,找到所需要的工作空间,单击工作空间的“数据开发”,系统跳转至数据开发页面。
  3. 在“作业开发”页面,新建数据开发子作业foreach。选择四个Dummy节点,选中连线图标并拖动,编排图5所示的作业。
  4. 右键单击节点间的连线,选择“设置条件”,在弹出的“编辑EL表达式”文本框中输入IF条件。

    每一个条件分支都需要填写IF条件,IF条件为通过EL表达式语法填写三元表达式。当三元表达式结果为true的时候,才会执行连线后面的节点,否则后续节点将被跳过

    • 上面的>5分支,IF条件表达式为:#{${result} > 5 ? "true" : "false"}
    • 中间的=5分支,IF条件表达式为:#{${result} == 5 ? "true" : "false"}
    • 下面的<5分支,IF条件表达式为:#{${result} < 5 ? "true" : "false"}

    输入IF条件表达式后,配置IF条件匹配失败策略,可选择仅跳过相邻的下一个节点,或者跳过该IF分支后续所有节点。

  5. 配置作业参数。此处需将参数名填写为result,仅用于主作业testif中的For Each节点识别子作业参数;参数值无需填写

    图6 配置作业参数

  6. 配置完成后保存作业。

开发主作业

  1. 在“作业开发”页面,新建数据开发主作业testif。选择HIVE SQL节点和For Each节点,选中连线图标并拖动,编排图4所示的作业。
  2. 配置HIVE SQL节点属性。此处配置为引用SQL脚本,SQL脚本的语句如下所示。其他节点属性参数无特殊要求。

    SELECT count(*) FROM student //从student表中计数,脚本执行结果为二维数组
    图7 HIVE SQL脚本执行结果

  3. 配置For Each节点属性,如图8所示。

    • 子作业:子作业选择已经开发完成的子作业“foreach”。
    • 数据集:数据集就是HIVE SQL节点的Select语句的执行结果。使用EL表达式#{Job.getNodeOutput('HIVE')}其中HIVE为前一个节点的名称。
    • 作业运行参数:作业运行参数是子作业中定义的参数,可以将主作业前一个节点的输出,传递到子作业以供使用。此处变量名为子作业参数名result,其值为数据集中的某一列,使用EL表达式#{Loop.dataArray[0][0]}
    图8 For Each节点属性

  4. 配置完成后保存作业。

测试运行主作业

  1. 点击主作业画布上方的“测试运行”按钮,测试作业运行情况。主作业运行后,会通过For Each节点自动调用运行子作业。
  2. 点击左侧导航栏中的“实例监控”,进入实例监控中查看作业运行结果。
  3. 待作业运行完成后,从实例监控中查看子作业foreach的运行结果,如图9所示。可以看到运行结果是符合预期的,当前HIVE SQL执行的结果是1,所以>5和=5的分支被跳过,执行<5这个分支成功。

    图9 子作业运行结果

多IF条件下当前节点的执行策略

如果当前节点的执行依赖多个IF条件的节点,执行的策略包含逻辑或和逻辑与两种。

当执行策略配置为逻辑或,则表示多个IF判断条件只要任意一个满足条件,则执行当前节点。

当执行策略配置为逻辑与,则表示多个IF判断条件需要所有条件满足时,才执行当前节点。

如果没有配置执行策略,系统默认为逻辑或处理。

图10 多IF条件作业样例

配置方法

配置执行策略

  1. 登录DataArts Studio控制台,找到所需要的DataArts Studio实例,单击实例卡片上的“进入控制台”,进入概览页面。
  2. 选择“空间管理”页签,在工作空间列表中,找到所需要的工作空间,单击工作空间的“数据开发”,系统跳转至数据开发页面。
  3. 在数据开发模块,单击“配置管理 > 配置”,单击“默认项配置”。
  4. “多IF策略”可设置为“逻辑与”或者“逻辑或”。
  5. 单击“保存”。

开发作业

  1. 在“作业开发”页面,新建一个数据开发作业。
  2. 拖动三个DWS SQL算子作为父节点,一个Python算子作为子节点,选中连线图标并拖动,编排图10所示的作业。
  3. 右键单击节点间的连线,选择“设置条件”,在弹出的“编辑EL表达式”文本框中输入IF条件。

    每一个条件分支都需要填写IF条件,IF条件为通过EL表达式语法填写三元表达式。

    • test1节点IF条件表达式为:#{(Job.getNodeStatus("test1")) == "success" ? "true" : "false"},
    • test2节点IF条件表达式为:#{(Job.getNodeStatus("test2")) == "success" ? "true" : "false"},
    • test3节点IF条件表达式为:#{(Job.getNodeStatus("test3")) == "success" ? "true" : "false"},

    此处表达式均采用前一个节点的执行状态进行IF条件判断。

    输入IF条件表达式后,配置IF条件匹配失败策略,可选择仅跳过相邻的下一个节点,或者跳过该IF分支后续所有节点。

测试运行作业

  1. 单击作业画布上方的“保存”按钮,保存完成编排的作业。
  2. 单击作业画布上方的“测试运行”按钮,测试作业运行情况。

    test1运行成功,则对应的IF条件为true;

    test2运行成功,则对应的IF条件为true;

    test3运行失败,则对应的IF条件为false。

    多IF策略配置为“逻辑或”时,showtables节点运行完成,作业运行完成。详细情况如下所示。

    图11 配置为“逻辑或”的作业运行情况

    多IF策略配置为“逻辑与”时,showtables节点跳过,作业运行完成。详细情况如下所示。

    图12 配置为“逻辑与”的作业运行情况

我们使用cookie来确保您的高速浏览体验。继续浏览本站,即表示您同意我们使用cookie。 详情

文档反馈

文档反馈

意见反馈

0/500

标记内容

同时提交标记内容