首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
呼延十
掘友等级
后端工程师
还记得年少时的梦吗?
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
76
文章 76
沸点 0
赞
76
返回
|
搜索文章
最新
热门
详解快速选择算法(Lucene实现源码分析)
计算集合中第k大(小)的元素. 就是topK相关系列的问题,但是选择算法只需要找到第k个就好. 定义的接口除了选择还有交换. Lucene对于选择算法有两个实现,快速选择算法及基数选择算法.本文将详细分析快速选择算法的源码. 该类的路径是: org.apache.lucene.…
lucene系列(六)索引格式之fdt文件
本文介绍一下.fdt 文件的存储格式。 fdt 文件,以正排的方式,存储了 field 的原始真实数据。也就是说,你添加到所有中的所有 field 内容。都会存储在此文件中。 其中Header 和 Footer, 与其中文件并无差别。详细字段解释可以看 Lucene 系列(二)…
lucene系列(五)索引格式之fdm文件
首先学习一下 lucene 的索引文件结构。本文介绍 Field 相关信息的存储文件格式。 当你在写入 field 信息时,如果像下面这样,指定了 Stored. 也就是希望 lucene 能够保存你的原始 Field 信息,那么就会生成三个文件 .fdt .fdm .fdx.…
lucene系列(四)DirectMonotonicWriter源码分析
来学习一下DirectMonotonicWriter类的代码. 源码版本: 8.7.0 它不是一个通用的解决方案, 只适用于单调递增数组, 他通过计算元素之的增量, 让所有元素迅速变小. 之后使用DirectWriter来进行压缩存储,以获得更好的压缩率. 因此它很适合存储文件…
lucene系列(三)DirectWriter源码分析
本文学习下 Lucene 在存储大量整数时使用到的编码方法。 DirectWriter 用 bit 编码方式进行数组压缩的功能,它在整个数组的所有元素都不大的情况下能带来不错的压缩效果。 DirectWriter 是 Lucene 为整型数组重编码成字节数组的工具,它的底层包含…
lucene系列(二)int的变长存储与zigzag编码
lucene 代码量还是比较多的,在没有看的很明白的情况下,先写一写新学到的工具类的一些操作吧~也是收获很多。 在 lucene 写入索引文件时,为了节省空间,经常会对数据进行一些压缩,这篇文章介绍一种对 int, long 类型有用的压缩方式。即变长存储。 对变长数据的写入实…
lucene系列(一)什么是Lucene
接触搜索/推荐相关工作,也有两年了。工作里对lucene的接触不少,却也不精。最近工作里没有那么忙,因此想通过学习源码的方式,来对lucene进行一个系统的学习。 此外,听闻lucene源码堪称面对对象设计届的典范,也想从中吸收一些代码设计/开发方面的知识。最近老是感觉自己写的…
使用Fasttext构建你的第一个文本分类器
最近在做一些意图识别方面的工作,所以尝试一下用 fasttext 做一个文本分类器,学习记录如下。 首先,我们使用 fasttext 的目的是什么?是文本分类,即对一个词语,给出它所属于的类别。 原理这部分要跳过了,因为网上的原理文章特别多,如果各位感兴趣的话可以移步 goog…
2020 01 18 Redis系列(十一)Redis命令全集
以下摘自:Redis 官网。 总的来说,Redis 是一个基于内存的高性能的键值型数据库,也就是常说的 NoSQL, 可以用来作为数据库或者缓存。并且支持多种数据结构,包括字符串,散列,列表,集合,带有范围查询的排序集,位图,HyperLogLog,具有半径查询的地理空间索引和…
2020 01 17 Redis系列(十)Redis对象系统
其实关于本文,我犹豫再三。 对象系统值得写一篇文章吗?从技术上来讲,当然是值。但是对于我们大部分人来说,它都是隐身的。 结论:想那么多屁事,写就完事了。 正如上一篇文章提到的,Redis 不是生硬的使用前面介绍过的数据结构,来实现了字符串,列表,字典等等数据结构,而是精心打造了…
下一页
个人成就
优秀创作者
文章被点赞
779
文章被阅读
208,618
掘力值
5,586
关注了
4
关注者
1,855
收藏集
1
关注标签
25
加入于
2018-03-15