schedule-tool工具使用指导
概述
schedule-tool工具,用于提交数据源为SFTP的作业。提交作业前可以修改输入路径、文件过滤条件,当目标源为HDFS时,可以修改输出路径。
本章节适用于MRS 3.x及后续版本。
参数说明
| 
        配置参数  | 
      
        说明  | 
      
        示例  | 
     
|---|---|---|
| 
        server.url  | 
      
        Loader服务的浮动IP地址和端口。端口默认为21351。 为了兼容性,此处支持配置多个IP地址和端口,并以“,”进行分隔。其中第一个必须是Loader服务的浮动IP地址和端口,其余的可根据业务需求配置。  | 
      
        10.96.26.111:21351,127.0.0.2:21351  | 
     
| 
        authentication.type  | 
      
        登录认证的方式。 
  | 
      
        kerberos  | 
     
| 
        authentication.user  | 
      
        普通模式或者使用密码认证方式时,登录使用的用户。 keytab登录方式,则不需要设置该参数。  | 
      
        bar  | 
     
| 
        authentication.password  | 
      
        使用密码认证方式时,登录使用的用户密码。普通模式或者keytab登录方式,则不需要设置该参数。 用户需要对密码加密,加密方法如下: 
  | 
      
        -  | 
     
| 
        use.keytab  | 
      
        是否使用keytab方式登录。 
  | 
      
        true  | 
     
| 
        client.principal  | 
      
        使用keytab认证方式时,访问Loader服务的用户规则。 普通模式或者密码登录方式,则不需要设置该参数。  | 
      
        loader/hadoop.<系统域名> 
         说明: 
         用户可登录FusionInsight Manager,选择“系统 > 权限 > 域和互信”,查看“本端域”参数,即为当前系统域名。  | 
     
| 
        client.keytab  | 
      
        使用keytab认证方式登录时,使用的keytab文件所在目录。 普通模式或者密码登录方式,则不需要设置该参数。  | 
      
        /opt/client/conf/loader.keytab  | 
     
| 
        krb5.conf.file  | 
      
        使用keytab认证方式登录时,使用的krb5.conf文件所在目录。 普通模式或者密码登录方式,则不需要设置该参数。  | 
      
        /opt/client/conf/krb5.conf  | 
     
| 
        配置参数  | 
      
        说明  | 
      
        示例  | 
     
|---|---|---|
| 
        job.jobName  | 
      
        作业的名称。  | 
      
        job1  | 
     
| 
        file.fileName.prefix  | 
      
        文件名的前缀。  | 
      
        table1  | 
     
| 
        file.fileName.posfix  | 
      
        文件名的后缀。  | 
      
        .txt  | 
     
| 
        file.filter  | 
      
        文件过滤器,通过匹配文件名来过滤文件。 
  | 
      
        true  | 
     
| 
        date.day  | 
      
        顺延的天数,匹配导入文件的文件名中的日期。例如命令参数传入的日期是20160202,顺延天数是3,则匹配作业配置的输入路径中包含20160205日期字段的文件。详细使用见schedule-tool工具使用示例。  | 
      
        3  | 
     
| 
        file.date.format  | 
      
        待导入文件的文件名中所包含的日志格式。  | 
      
        yyyyMMdd  | 
     
| 
        parameter.date.format  | 
      
        调用脚本时,所输入的日期格式,一般保持与“file.date.format”一致。  | 
      
        yyyyMMdd  | 
     
| 
        file.format.iscompressed  | 
      
        待导入的文件是否为压缩文件。  | 
      
        false  | 
     
| 
        storage.type  | 
      
        存储类型。待导入文件最终保存的类型,分别有HDFS、HBase、Hive等。  | 
      
        HDFS  | 
     
 
   schedule-tool工具支持同时配置多个作业。配置多个作业时,表2中“job.jobName”、“file.fileName.prefix”、“file.fileName.posfix”参数需配置多个值,并且以“,”分隔。
注意事项
server.url属性必须需要配置两个IP地址和端口的格式串,用“,”分隔。