# 原理

# 倒排索引

下图是ElasticSearch的索引结构,下边黑色部分是物理结构,上边黄色部分是逻辑结构,逻辑结构也是为了更好的去描述ElasticSearch的工作原理及去使用物理结构中的索引文件。

1551515215556

逻辑结构部分是一个倒排索引表

1、将要搜索的文档内容分词,所有不重复的词组成分词列表Term

2、将搜索的文档最终以Document方式存储起来。

3、每个词Term和Docment都有关联

如下:

1551515296662

如果我们想搜索quick brown ,我们只需要查找包含每个词条的文档:

1551515315036

两个文档都匹配,但是第一个文档比第二个匹配度更高。如果我们使用仅计算匹配词条数量的简单相似性算法 ,那么我们可以说,对于我们查询的相关性来讲,第一个文档比第二个文档更佳。