首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
lucene源码系列
沧叔解码
创建于2022-04-04
订阅专栏
尽量输出网上少有人讲的lucene实现。
等 78 人订阅
共34篇文章
创建于2022-04-04
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
Lucene源码系列(十四):内存中倒排信息的读取
在上一篇文章中,我们已经介绍了倒排数据在内存中的存储结构以及如何一步步构建的,本文就接着来看怎么读取内存中的倒排数据。本文先分析源码,最后再以一个实际的例子来说明如何读取相关数据。
Lucene源码系列(十三):内存中倒排信息的构建
针对Lucene在内存中的倒排结构的超级硬核的解析。凭良心讲,写这篇文章难度很大,读者需要有很大的耐心来看,不要急于求成想一下子看明白,建议收藏,看完应该值得你点个赞!
Lucene源码系列(十二):FST的读取和查找
背景 在前面的文章中我们从源码以及图文示例的层面分别介绍了FST完整的构建逻辑,如果已经掌握了构建的逻辑,那么FST的读取和查找逻辑是比较简单的。 本文就是介绍如何使用FST,首先我们会介绍如何加载持
Lucene源码系列(十一):从一个例子来说说Lucene FST的构建
背景 在上一篇文章中我们从源码层面详细介绍了FST构建的完整流程,本文用一个例子,按步骤借助图文描述,巩固下构建的逻辑。我们使用的例子如下: 必要说明 虚线表示的是还可能变化的部分,实线是已经序列化完
Lucene源码系列(十):FST构建
背景 我们都知道检索引擎的核心是倒排,倒排就是term所在的文档列表(当然可以包含term在对应文档中的详细位置信息),但是怎么通过term来定位其倒排数据呢?这个问题的本质就是term映射倒排位置的
Lucene源码系列(九):可持久化的位图实现方案
如果你的应用内存无法装载位图或者为了内存的占用率,需要将位图持久化到文件系统,实现按需装载,这篇文章可以让你知道lucene中可持久化的位图的实现方式,基于这个我们也可以按需自定义开发。
Lucene源码系列(八):基于内存的位图实现方案
介绍了lucene中3种内存版的位图实现方式,内存浪费从多到少,示例图画结合源码的分析,从根上理解位图,也可帮助读者实现位图的自定义开发。
Lucene源码系列(七):你真的理解Lucene中的PhraseQuery吗?
从源码的层面解释Lucene中的PhraseQuery和MultiPhraseQuery。从本文中你可以知道Lucene中如何查找短语匹配的文档,以及Lucene现有的查找算法存在哪些问题。
Lucene源码系列(六):多个有序列表如何取交集?
Lucene中求倒排链的交集是一个十分重要的操作。在布尔查询或者是短语匹配中都会用到,而倒排链交集的算法的效率决定了Lucene这些查询的效率。我们一起看看Lucene中是如何实现的~
Lucene源码系列(五):UnifiedHighlighter高亮算法实现
Lucene高亮系列的完结篇,介绍Lucene大一统的高亮解决方案,内容很全,所以文章很长。 到此Lucene高亮三种在工业界(elasticsearch,solr)常用的方案实现分析完毕。
Lucene源码系列(四):FastVectorHighlighter高亮算法实现
Lucene高亮第二个方案FastVectorHighlighter全面解析,它在部分场景中解决了Lucene的第一个方案Highlighter问题,具体如何解决一起来看看吧~
Lucene源码系列(三):Highlighter高亮算法实现
lucene高亮实现方案系列之一:深入理解Lucene高亮算法Highlighter底层实现原理以及缺陷
lucene源码系列(一):HNSW实现
全网首发!!!lucene最新版本9.1.0中HNSW源码深入解析,从头扣到脚,看懂这个,自己用不同语言都可DIY。
lucene源码系列(二):向量数据读写分析
Lucene向量数据读写分析。当前Lucene最新版本中的向量近邻检索算法只有HNSW一个,所以目前的向量数据