实现一个简化版本的Lucene最近费了点时间参考lucene早期版本，写了个简单的搜索demo，大概又了解了下搜索的过程

全文检索很常见我理解的平时用到的很多感觉都是属于这类的只不过量有点小，量上来了需要用到一些方法对文本进行处理那就是倒排索引了。

索引（整个索引需要的文件信息
段（包含当前的一个索引分片标志，目的是用来拆分数据的；为什么要拆分数据因为需要检索的量大，还有如果要更新某个文档（索引的文件都是按照顺序写好的落盘后不能再次修改的，并且构建索引会非常的耗时，段可以进行小块更新相对来说效率更高）。可以理解为数据库的表结构
文档（可以理解为某个类型的里面的一个信息。例如数据库表里面的某条数据
域（可以理解为文档里面的信息分类，就像数据库表里面的字段），（域写入的时候可以加一些其他的内容Payload信息
词（词频、词偏移量);词是从域里面产生的一般对域的内容进行分词（传统的是依赖字典吧，但是现在AI处理这些会更好些，比如：纠词、同义词类的
查询解析（这里面也分好多东西画了个简单的流程图