从零开始使用Loader

用户可以使用Loader将数据从SFTP服务器导入到HDFS。

本章节适用于MRS 3.x之前版本。

访问Loader页面。
1. 登录集群详情页面，选择“服务管理”。
2. 选择“Hue”，在“Hue概述”的“Hue WebUI”，单击“Hue (主)”，打开Hue的WebUI。
3. 选择“Data Browsers > Sqoop”。
  默认显示Loader页面中的作业管理界面。
在Loader页面，单击“管理连接”。
单击“新建连接”，参考文件服务器连接，创建sftp-connector。
单击“新建连接”，输入连接名称，选择连接器为hdfs-connector，创建hdfs-connector。
访问Loader页面，单击“管理作业”。
单击“新建作业”。
在“基本信息”填写参数。
1. 在“名称”填写一个作业的名称。
2. 选择3创建的“源连接”和4创建的“目的连接”。
在“自”填写源连接的作业配置。

具体请参见ftp-connector或sftp-connector。
在“至”填写目的连接的作业配置。

具体请参见hdfs-connector。

在“任务配置”填写作业的运行参数。

表1 Loader作业运行属性
参数	说明
抽取并发数	设置map任务的个数。
加载(写入)并发数	设置reduce任务的个数。该参数只有在目的字段为Hbase和Hive时才会显示。
单个分片的最大错误记录数	设置一个错误阈值，如果单个map任务的错误记录超过设置阈值则任务自动结束，已经获取的数据不回退。说明： “generic-jdbc-connector”的“MYSQL”和“MPPDB”默认批量读写数据，每一批次数据最多只记录一次错误记录。
脏数据目录	设置一个脏数据目录，在出现脏数据的场景中在该目录保存脏数据。如果不设置则不保存。

父主题： 使用Loader

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消