Elastic Search(ES)是一个开源全文搜索引擎,
1. 非结构化的数据的查询方式:
什么是非结构化数据:
- 结构化数据:有固定格式或有限长度的数据,如数据库、元数据等。
- 非结构化数据:不定长或无结构的数据,如邮件、文档等文件。
非结构化数据的查询方式
- 顺序查询
- 全文检索:先建立索引再检索
全文检索技术
Lucene是apache下一个开源全文检索包,ES和Solr都是基于Lucene的。
graph TD
原始文档 --> 构建文档对象 --> 分词 --> 创建索引 --> 得到索引库
用户查询接口 --> 构建查询 --> 执行查询 --> 渲染结果
倒排索引
倒排索引:根据内容(词语)找文档。