基本概念
索引
用于存储搜索的数据,是一个或多个分片分组在一起的逻辑空间。
文档
Elasticsearch存储的实体,是可以被索引的基本单位,相当于关系型数据库中的行。
文档类型
类似关系型数据库中的表,用于区分不同的数据,一个索引可以包含若干个文档类型,每个文档必须设定它的文档类型。
映射
用来约束字段的类型,可以根据数据自动创建。相当于数据库中的Schema。
字段
组成文档的最小单位。相当于数据库中的Column。
数据源
用户数据的来源。
召回
通过查询的关键词进行分词,将分词后的词组通过查找倒排链表快速定位到文档。
召回量
召回得到的文档数。
分词
对文档进行词组切分,TEXT类型按检索单元切分,SHORT_TEXT按单字切分。如“华为公司”,TEXT类型会切分成2个词组:“华为”“公司”。SHORT_TEXT会切分成4个词组:“华”“为”“公”“司”。