配置Elasticsearch/云搜索服务源端参数
作业中源连接为Elasticsearch连接参数说明或云搜索服务(CSS)连接参数说明时,源端作业参数如表1所示。
| 
       参数类型  | 
     
       参数名  | 
     
       说明  | 
     
       取值样例  | 
    
|---|---|---|---|
| 
       基本参数  | 
     
       索引  | 
     
       Elasticsearch的索引,类似关系数据库中的数据库名称。索引名称只能全部小写,不能有大写。  | 
     
       index  | 
    
| 
       类型  | 
     
       Elasticsearch的类型,类似关系数据库中的表名称。类型名称只能全部小写,不能有大写。 
        说明: 
        Elasticsearch搜索引擎7.x及以上版本不支持自定义类型,只能使用_doc类型。此处即使自定义也不会生效。  | 
     
       _doc  | 
    |
| 
       高级属性  | 
     
       拆分nested类型字段  | 
     
       可选参数,选择是否将nested字段的json内容拆分,例如:将“a:{ b:{ c:1, d:{ e:2, f:3 } } }”拆成三个字段“a.b.c”、“a.b.d.e”、“a.b.d.f”。  | 
     
       否  | 
    
| 
       过滤条件  | 
     
       
       可选参数,CDM只迁移满足过滤条件的数据。
        
  | 
     
       last_name:Smith  | 
    |
| 
       抽取元字段  | 
     
       表示是否抽取索引的元字段,目前只支持(_index、_type、_id、_score)例如:_index、_type、_id、_score  | 
     
       是  | 
    |
| 
       分页大小  | 
     
       Elasticsearch分页查询,用来设置分页size的大小。  | 
     
       1000  | 
    |
| 
       ScrollId超时时间配置  | 
     
       Elasticsearch scroll查询时会记录一个scroll_id,超时或者scroll查询结束后会清除请求的srcoll_id,通过设置这个超时时间配置,来指定scroll_id超时时间。  | 
     
       5  |