首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
沧叔解码
掘友等级
大头兵
|
杭州华为
大头兵的消亡史
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
26
文章 25
沸点 1
赞
26
返回
|
搜索文章
最新
热门
Lucene源码系列(二十四):DocValues-BinaryDocValues
前面我们介绍的两种DocValues都是数值类型的。今天我们要开始介绍字符串类型的DocValues。
Lucene源码系列(二十三):DocValues-SortedNumericDocValues
本文介绍SortedNumericDocValues,它和NumericDocValues的区别是每个文档只能有一个NumericDocValues字段,但是可以有多个同名的SortedNumeric
Lucene源码系列(二十二):DocValues-NumericDocValues
本文介绍第一种DocValue类型:NumericDocValues。NumericDocValues是其他一些DocValue的基础,所以我们先行介绍。
Lucene源码系列(二十一):DocValues-综述
DocValues也是用来存储文档的字段的值的,正排索引也是用来存储字段值的,那它们有什么区别?为什么有了正排索引之后还要设计一个DocValues?
Lucene源码系列(二十):正排索引文件构建
背景 Lucene中根据term字典和倒排可以快速查找到相关文档的id,那怎么获取文档中的字段内容呢,这就是我们今天要讲的正排数据。
Lucene源码系列(十九):多值编码压缩算法
之前在看索引文件构建的源码时,会经常碰到对于正整数的批量压缩应用,而且有好几个不同的类,当时都是把它们当成黑盒忽略,现在花了点时间,总算是把这些不同应用场景都区分了。
Lucene源码系列(十八):单值编码压缩算法
本文收集了我在看Lucene源码中遇到的所有的对单值(int,long,float,double)的压缩算法,可能一种类型针对不同的场景会有多种不同的压缩策略,本文会随着我自己的源码阅读不断持续更新。
Lucene源码系列(十七):词向量索引文件构建
词向量存储的数据和倒排索引的数据是完全一样的,但是因为使用的场景不同导致二者的存储结构不同。倒排索引用于检索,词向量的一个最经常的应用是高亮。
Lucene源码系列(十六):term字典的构建
全文检索引擎最核心的两块数据就是term字典和term的倒排索引,根据倒排索引我们可以非常快速的获取跟term相关的文档,但是如何根据term来获取term的倒排索引数据呢?这就需要term字典了。
Lucene源码系列(十五):倒排索引文件生成
在前面的文章中,我们已经知道了倒排信息在内存中的存储结构以及如何读取。本文要介绍的是倒排信息持久化成索引文件的过程。
下一页
个人成就
文章被点赞
160
文章被阅读
58,173
掘力值
1,331
关注了
8
关注者
143
收藏集
3
关注标签
4
加入于
2019-07-23