配置Elasticsearch/云搜索服务源端参数
作业中源连接为Elasticsearch连接参数说明或云搜索服务(CSS)连接参数说明时,源端作业参数如表1所示。
参数类型 | 参数名 | 说明 | 取值样例 |
|---|---|---|---|
基本参数 | 索引 | Elasticsearch的索引,类似关系数据库中的数据库名称。索引名称只能全部小写,不能有大写。 | index |
类型 | Elasticsearch的类型,类似关系数据库中的表名称。类型名称只能全部小写,不能有大写。 说明: Elasticsearch搜索引擎7.x及以上版本不支持自定义类型,只能使用_doc类型。此处即使自定义也不会生效。 | _doc | |
高级属性 | 拆分nested类型字段 | 可选参数,选择是否将nested字段的json内容拆分,例如:将“a:{ b:{ c:1, d:{ e:2, f:3 } } }”拆成三个字段“a.b.c”、“a.b.d.e”、“a.b.d.f”。 | 否 |
过滤条件 | 可选参数,CDM只迁移满足过滤条件的数据。
| last_name:Smith | |
抽取元字段 | 表示是否抽取索引的元字段,目前只支持(_index、_type、_id、_score)例如:_index、_type、_id、_score | 是 | |
分页大小 | Elasticsearch分页查询,用来设置分页size的大小。 | 1000 | |
ScrollId超时时间配置 | Elasticsearch scroll查询时会记录一个scroll_id,超时或者scroll查询结束后会清除请求的scroll_id,通过设置这个超时时间配置,来指定scroll_id超时时间。 | 5 |

