配置Hive目的端参数
支持快速导入数据到MRS的Hive。
类别 | 参数名 | 说明 | 取值样例 |
|---|---|---|---|
基本参数 | 数据库 | 输入或选择写入数据的数据库名称。单击输入框后面的按钮可进入数据库选择界面。 | default |
表名 | 输入或选择写入数据的目标表名。单击输入框后面的按钮可进入表的选择界面。 该参数支持配置为时间宏变量,且一个路径名中可以有多个宏定义变量。使用时间宏变量和定时任务配合,可以实现定期同步新增数据,详细说明请参见使用时间宏变量完成增量同步。 说明: 如果配置了时间宏变量,通过DataArts Studio数据开发调度CDM迁移作业时,系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”,而不是“CDM作业实际启动时间-偏移量”。 | TBL_X | |
hive写入模式 | 选择hive的写入模式。
| LOAD_OVERWRITE | |
分区过滤条件 | TRUNCATE模式,支持多组分区,并在对应的输入框填的值即可。 LOAD_OVERWRITE模式,仅支持写入一组分区。 | - | |
高级属性 | 是否将null转换为“null” | 配置null值的转换类型。
| TO_NULL |
换行符处理方式 | 对于写入hive textfile格式表的数据中存在换行符的场景,指定对换行符的处理策略。 支持删除,替换为其它字符串及不处理三种方式。 | 删除 | |
换行符替换字符串 | 换行符处理方式设置为“替换为其他字符串”时,呈现此参数。 当换行符处理方式选择为替换时,指定替换的字符串。 | - | |
执行Analyze语句 | 数据全部写入完成后会异步执行ANALYZE TABLE语句,用于优化Hive表查询速度,执行的SQL如下:
说明:
| 是 |

