文档首页/ 数据湖探索 DLI/ SQL语法参考（即将下线）/ Spark SQL语法参考（即将下线）/ 内置函数/ 字符串函数/ regexp_extract

更新时间：2023-09-27 GMT+08:00

regexp_extract

REGEXP_EXTRACT函数用于将字符串source按照pattern的分组规则进行字符串匹配，返回第groupid个组匹配到的字符串内容。

命令格式

regexp_extract(string <source>, string <pattern>[, bigint <groupid>])

参数说明

表1 参数说明
参数	是否必选	参数类型	说明
source	是	STRING	待拆分的字符串。
pattern	是	STRING	STRING类型常量或正则表达式。待匹配的模型。
groupid	否	BIGINT	BIGINT类型常量，必须大于等于0。

返回值说明

返回STRING类型。

如果pattern为空串或pattern中没有分组，返回报错。
groupid非BIGINT类型或小于0时，返回报错。
不指定时默认为1，表示返回第一个组。
如果groupid等于0，则返回满足整个pattern的子串。
source、pattern或groupid值为NULL时，返回NULL。

示例代码

将 basketball 按照 bas(.*?)(ball) 拆分。返回ket。

select regexp_extract('basketball', 'bas(.*?)(ball)');

返回 basketball 。

select regexp_extract('basketball', 'bas(.*?)(ball)',0);

返回99。在DLI上提交正则计算的SQL，需要使用两个"\"作为转义字符。

select regexp_extract('8d99d8', '8d(\\d+)d8');

返回【你好】。

select regexp_extract('【你好】hello', '([^\\x{00}-\\x{ff}]+)');

返回你好。

select regexp_extract('【你好】hello', '([\\x{4e00}-\\x{9fa5}]+)');

父主题： 字符串函数

上一篇：regexp_count

下一篇：replace

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

智能客服提问云社区提问

regexp_extract

命令格式

参数说明

返回值说明

示例代码

相关文档

意见反馈

文档内容是否对您有帮助？

7*24

备案

专业服务

退订

建议反馈

售前咨询热线