配置Elasticsearch/云搜索服务源端参数
作业中源连接为Elasticsearch连接参数说明或云搜索服务(CSS)连接参数说明时,源端作业参数如表1所示。
参数类型 |
参数名 |
说明 |
取值样例 |
---|---|---|---|
基本参数 |
索引 |
Elasticsearch的索引,类似关系数据库中的数据库名称。索引名称只能全部小写,不能有大写。 |
index |
类型 |
Elasticsearch的类型,类似关系数据库中的表名称。类型名称只能全部小写,不能有大写。
说明:
Elasticsearch搜索引擎7.x及以上版本不支持自定义类型,只能使用_doc类型。此处即使自定义也不会生效。 |
_doc |
|
高级属性 |
拆分nested类型字段 |
可选参数,选择是否将nested字段的json内容拆分,例如:将“a:{ b:{ c:1, d:{ e:2, f:3 } } }”拆成三个字段“a.b.c”、“a.b.d.e”、“a.b.d.f”。 |
否 |
过滤条件 |
可选参数,CDM只迁移满足过滤条件的数据。
|
last_name:Smith |
|
抽取元字段 |
表示是否抽取索引的元字段,目前只支持(_index、_type、_id、_score)例如:_index、_type、_id、_score |
是 |
|
分页大小 |
Elasticsearch分页查询,用来设置分页size的大小。 |
1000 |
|
ScrollId超时时间配置 |
Elasticsearch scroll查询时会记录一个scroll_id,超时或者scroll查询结束后会清除请求的srcoll_id,通过设置这个超时时间配置,来指定scroll_id超时时间。 |
5 |