文档首页 > > 用户指南> 作业管理> 配置作业源端参数> 配置Hive源端参数

配置Hive源端参数

分享
更新时间:2020/08/12 GMT+08:00

作业中源连接为配置Hive连接时,源端作业参数如表1所示。

表1 Hive作为源端时的作业参数

参数名

说明

取值样例

数据库名称

输入或选择数据库名称。单击输入框后面的按钮可进入数据库选择界面。

default

表名

输入或选择Hive表名。单击输入框后面的按钮可进入表的选择界面。

该参数支持配置为时间宏变量,且一个路径名中可以有多个宏定义变量。使用时间宏变量和定时任务配合,可以实现定期同步新增数据,详细说明请参见使用时间宏变量完成增量同步

TBL_E

分区过滤条件

单击“显示高级属性”后显示此参数。

该参数表示抽取指定值的partition,可以配置多个值(空格分隔),也可以配置范围,接受时间宏函数。

  • 单/多值过滤:

    "${dateformat(yyyyMMdd, -1, DAY)} ${dateformat(yyyyMMdd)}"

  • 范围过滤:

    "${value} >= ${dateformat(yyyyMMdd, -7, DAY)} && ${value} < ${dateformat(yyyyMMdd)}"

Hive作为数据源,CDM自动使用Hive数据分片文件进行数据分区。

分享:

    相关文档

    相关产品

文档是否有解决您的问题?

提交成功!非常感谢您的反馈,我们会继续努力做到更好!
反馈提交失败,请稍后再试!

*必选

请至少选择或填写一项反馈信息

字符长度不能超过200

提交反馈 取消

如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨

智能客服提问云社区提问