首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
李同志57242
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
14
文章 14
沸点 0
赞
14
返回
|
搜索文章
赞
文章( 14 )
沸点( 0 )
Lucene源码系列(十三):内存中倒排信息的构建
针对Lucene在内存中的倒排结构的超级硬核的解析。凭良心讲,写这篇文章难度很大,读者需要有很大的耐心来看,不要急于求成想一下子看明白,建议收藏,看完应该值得你点个赞!
Lucene源码系列(十四):内存中倒排信息的读取
在上一篇文章中,我们已经介绍了倒排数据在内存中的存储结构以及如何一步步构建的,本文就接着来看怎么读取内存中的倒排数据。本文先分析源码,最后再以一个实际的例子来说明如何读取相关数据。
Lucene源码系列(十五):倒排索引文件生成
在前面的文章中,我们已经知道了倒排信息在内存中的存储结构以及如何读取。本文要介绍的是倒排信息持久化成索引文件的过程。
Lucene源码系列(二十五):DocValues-SortedDocValues
SortedDocValues存储的也是二进制,并且都是每个文档同名的最多一个,但是SortedDocValues在存储的时候会全局排序,所以存储的结构会复杂很多。
Lucene源码系列(二十六):DocValues-SortedSetDocValues
SortedSetDocValues和BinaryDocValues的关系就像SortedNumericDocValues和NumericDocValues的关系一样。
Lucene源码系列(二十七):BKD树构建
本文介绍完全二叉BKD树的构建,先从一个简单的面试题入手,整体上了解构建流程,想知道BKD树逻辑上如何构建看到这里即可。如果还要深入了解,也有源码解析。最后有索引文件的总结。
Lucene源码系列(二十八):si索引文件格式
lucene索引的最小单位是段,每当生成一个新的段时(flush,commit,merge,addIndexes等),会生成一个段信息的描述文件,后缀是si。
Lucene源码系列(二十九):fnm索引文件格式
后缀为fnm文件是存储索引的全部字段的元信息,包含字段名称,字段类型,字段属性,索引数据构建的类型等信息。
Lucene源码系列(三十):segments_N索引文件格式
segments_N文件 简介 在调用IndexWriter.commit方法后,索引目录会生成segments_N一个文件,用来描述当前索引目录中所有有效的段的信息,也就是si文件。
Lucene源码系列(三十一):索引删除策略
本文介绍Lucene中索引删除策略,它是以IndexCommit为粒度进行管理的,本文是为了后面介绍文件粒度管理做铺垫。
下一页
关注了
20
关注者
0
收藏集
1
关注标签
5
加入于
2018-09-25