首页
首页
沸点
课程
直播
活动
竞赛
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
吳YH堅
掘友等级
不以物喜,不以己悲
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
赞
9
文章 9
沸点 0
赞
9
返回
|
搜索文章
文章
热门
最新
你真的了解跳跃表吗
最近换了工作,因为工作的需要,也正好自己想好好研究一下 Java 这门牛逼的语言,看了一下 ElasticSearch 和 Lucene 的源码,之前从来没有写过也没有看过 Java 的东西,所以也算是恶补了一下 Java 吧,由于是从 C 程序员开始的,所以对这种带虚拟机的语言总有一些偏见,老觉得内…
输入一个URL
前几天看到一个题目,问在浏览器中输入一个URL会发生神马,这好像是网上比较流行的面试题,而且也被回答烂了,仔细想下来,要是自己遇到这个题目能不能答上来,后来一想,这个题目要完全答出来可以把大学开始的几乎所有知识都用上。呵呵,为了模拟面试,所以都凭印象说的,没有查网络资料,所以估…
爬了价值1800亿的商品信息
写在前面的话 好久没来了,今天来聊聊个有意思的吧,这些天由于一些原因,自己撸了个爬虫框架,因为要测试一下效果,于是到处爬东西,爬了不少有意思的数据,后面也会说一些别的数据,那天,连爬了四天绿中介的网站,说句实在的,绿中介反爬做得还行,阵亡好多代理ip,而且有些个代理还没用就已经…
用 Golang 写一个搜索引擎(0x09)— 数据增,删,改
根据某位和我同姓的朋友的建议,后面的文章都会加上副标题,方便查阅。 今天的文章会比较短,很快就能看完。 按照步骤,说完段层以后,应该就开始涉及到索引层了,但我想说的是一个分布式的搜索引擎,所以除了索引层以外,还有个分片层,这两个概念是紧密联系在一起的,我怕说不好,所以在说索引层…
用 Golang 写一个搜索引擎(0x08)--- 索引的段
我觉得这个标题应该改改了,我写下来其实是告诉大家怎么写一个搜索引擎,并没有涉及太多的 Golang 的东西,我觉得这样也挺好,熟悉了原理,用什么实现其实并不重要了,而且说说原理比说代码更实在。 之前已经说了底层的数据结构了,包括倒排和正排索引。今天我们上一层,来说说索引的字段和段。…
用 Golang 写一个搜索引擎(0x07)--- 正排索引
最近各种技术盛会太多,朋友圈各种刷屏,有厂商发的各种广告,有讲师发的各种自拍,各种参会的朋友们各种自拍,好不热闹,不知道你的朋友圈是不是也是这样啊,去年还没这么多技术会议,今年感觉爆发了,呵呵,真是一个互联网技术的好时代,而且还有各种撕 B 可看,真想八一八,怕得罪人,我们这种码农…
用 Golang 写一个搜索引擎(0x06)--- 索引构建
不知不觉写到第七篇了,按这个节奏,估计得写到 15 到 20 篇左右才能写完,希望自己能坚持下去,之前写代码的时候很多东西并没有想得那么细致,现在每写一篇文章还要查一些资料,确保文章的准确性,也相当于自己复习了一下吧,呵呵。 先说一下,关于倒排文件,其实还有很多东西没有讲,到后面再统一…
用Golang写一个搜索引擎(0x05)--- 文本相关性排序
上面我们已经说过了一些倒排索引的东西,并且也知道了如何来实现一个倒排索引完成检索功能,那么检索完了以后如何排序呢,这一篇简单的说一下倒排索引的文本相关性排序,因为排序实在是太复杂了,我们这里就说说文本的相关性排序,而且是最简单的TD-IDF排序,之后有机会可以再说说整个搜索的排…
用 Golang 写一个搜索引擎 (0x04) --- B + 树
本篇较长较枯燥,请保持耐心看完。 前面两章介绍了一下倒排索引以及倒排索引字典的两种存储结构,分别是跳跃表和哈希表,本篇我们介绍另一种数据结构,他也被大量使用在信息检索领域,我在 github 上实现的搜索引擎的词典也是用的这个数据结构,它就是 B + 树。 首先,我们看看什么是树,树是程…
用 Golang 写一个搜索引擎(0x03)--- 跳跃表,哈希表
前面已经说了倒排索引的基本原理了,原理非常简单,也很好理解,关键是如何设计第二个倒排表,倒排表的第二列也很好设计,第一列就是关键了,为了满足快速查找的性能,设计第一列的结构,我们需要满足以下两个条件。 查找非常快,能在极短的时间内找到我们需要的关键词所在的位置。 添加关键词也需…
下一页
个人成就
优秀创作者
文章被点赞
1,600
文章被阅读
50,925
掘力值
2,568
关注了
2
关注者
555
收藏集
0
关注标签
17
加入于
2016-05-31