文档首页/ 数智融合计算服务 DataArtsFabric/ 开发指南/ 数智融合（Data+AI）/ DataArtsFabric DataFrame/ 使用DataFrame API注册Scalar UDF/ Scalar UDF类型

更新时间：2025-09-18 GMT+08:00

查看PDF

Scalar UDF类型

对于DataArtsFabric DataFrame，目前提供Python端可以注册的Scalar UDF类型如下：

表1 Scalar UDF类型
Scalar UDF类型	输入类型	是否向量化	适用场景与特点
python	Python标量值	否	逐行处理数据，适用于简单或特定的计算，但性能较低。
builtin	后端支持的类型	否	直接调用数据库后端已存在的函数，适用于利用数据库原生功能的场景。
pandas	pandas.Series	是	利用Pandas的矢量化操作，适用于需要在Python层进行复杂数据处理的场景。
pyarrow	pyarrow.Array	是	利用PyArrow的高性能计算能力，适用于需要处理大型数据集或进行高效计算的场景。

对于Scalar UDF，目前只实现了python、builtin类型，后续版本会有修改调整，添加pyarrow、pandas等类型。

Scalar UDF的设计总原则是：用户本身的Python函数在无数据库参与的情况下可以正确运行，为了靠近原始数据/追求更好的性能而使用了数据库的UDF特性，尽可能减少用户为了使用UDF而修改原始代码的工作量。

父主题： 使用DataFrame API注册Scalar UDF

上一篇：使用DataFrame API注册Scalar UDF

下一篇：注册Scalar UDF概览

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消