更新时间:2024-12-11 GMT+08:00
分享

JOIN

Equi-join

语法格式

1
2
FROM tableExpression INNER | LEFT | RIGHT | FULL JOIN tableExpression
  ON value11 = value21 [ AND value12 = value22]

注意事项

  • 目前仅支持 equi-join ,即 join 的联合条件至少拥有一个相等谓词。不支持任何 cross join 和 theta join。
  • Join 的顺序没有进行优化,join 会按照 FROM 中所定义的顺序依次执行。请确保 join 所指定的表在顺序执行中不会产生不支持的 cross join (笛卡儿积)以致查询失败。
  • 流查询中可能会因为不同行的输入数量导致计算结果的状态无限增长。请提供具有有效保留间隔的查询配置,以防止出现过多的状态。

示例

SELECT *
FROM Orders INNER JOIN Product ON Orders.productId = Product.id;

SELECT *
FROM Orders LEFT JOIN Product ON Orders.productId = Product.id;

SELECT *
FROM Orders RIGHT JOIN Product ON Orders.productId = Product.id;

SELECT *
FROM Orders FULL OUTER JOIN Product ON Orders.productId = Product.id;

Time-windowed Join

功能描述

每条流的每一条数据会与另一条流上的不同时间区域的数据进行JOIN。

语法格式

from t1 JOIN t2 ON t1.key = t2.key AND TIMEBOUND_EXPRESSIO

语法描述

TIMEBOUND_EXPRESSION 有两种写法,如下:

  • L.time between LowerBound(R.time) and UpperBound(R.time)
  • R.time between LowerBound(L.time) and UpperBound(L.time)
  • 带有时间属性(L.time/R.time)的比较表达式。

注意事项

时间窗口join需要至少一个 equi-join 谓词和一个限制了双方时间的 join 条件。

例如使用两个适当的范围谓词(<, <=, >=, >),一个 BETWEEN 谓词或一个比较两个输入表中相同类型的时间属性(即处理时间和事件时间)的相等谓词

比如,以下谓词是合法的窗口 join 条件:

  • ltime = rtime
  • ltime >= rtime AND ltime < rtime + INTERVAL '10' MINUTE
  • ltime BETWEEN rtime - INTERVAL '10' SECOND AND rtime + INTERVAL '5' SECOND

示例

所有在收到后四小时内发货的 order 会与它们相关的 shipment 进行 join。

SELECT *
FROM Orders o, Shipments s
WHERE o.id = s.orderId AND
      o.ordertime BETWEEN s.shiptime - INTERVAL '4' HOUR AND s.shiptime;

Expanding arrays into a relation

注意事项

目前尚未支持非嵌套的 WITH ORDINALITY 。

示例

SELECT users, tag
FROM Orders CROSS JOIN UNNEST(tags) AS t (tag);

Join表函数(UDTF)

功能描述

将表与表函数的结果进行 join 操作。左表(outer)中的每一行将会与调用表函数所产生的所有结果中相关联行进行 join 。

注意事项

针对横向表的左外部连接当前仅支持文本常量 TRUE 作为谓词。

示例

若表函数返回了空结果,左表(outer)的行将会被删除

SELECT users, tag
FROM Orders, LATERAL TABLE(unnest_udtf(tags)) t AS tag;

若表函数返回了空结果,将会保留相对应的外部行并用空值填充

SELECT users, tag
FROM Orders LEFT JOIN LATERAL TABLE(unnest_udtf(tags)) t AS tag ON TRUE;

Join Temporal Table Function

功能描述

注意事项

目前仅支持在 Temporal Tables 上的 inner join

示例

假如Rates是一个 Temporal Table Function, join 可以使用 SQL 进行如下的表达:

SELECT
  o_amount, r_rate
FROM
  Orders,
  LATERAL TABLE (Rates(o_proctime))
WHERE
  r_currency = o_currency;

Join Temporal Tables

功能描述

与Temporal表进行join操作

语法格式

SELECT column-names
FROM table1  [AS <alias1>]
[LEFT] JOIN table2 FOR SYSTEM_TIME AS OF table1.proctime [AS <alias2>]
ON table1.column-name1 = table2.key-name1

语法说明

  • table1.proctime表示table1的proctime处理时间属性(计算列)
  • 使用FOR SYSTEM_TIME AS OF table1.proctime表示当左边表的记录与右边的维表join时,只匹配当前处理时间维表所对应的的快照数据。

注意事项

仅支持带有处理时间的 temporal tables 的 inner 和 left join

示例

假设 LatestRates 是一个根据最新的 rates 物化的Temporal Table。

SELECT
  o.amout, o.currency, r.rate, o.amount * r.rate
FROM
  Orders AS o
  JOIN LatestRates FOR SYSTEM_TIME AS OF o.proctime AS r
  ON r.currency = o.currency;

相关文档