首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
搜索技术
订阅
法克吹杨
更多收藏集
微信扫码分享
微信
新浪微博
QQ
16篇文章 · 0订阅
搜索系统核心技术概述【1.5w字长文】
搜索引擎介绍 搜索引擎(Search Engine),狭义来讲是基于软件技术开发的互联网数据查询系统,用户通过搜索引擎查询所需信息,如日常使用的Baidu、Google等;广义上讲,搜索引擎是信息检索
美团外卖搜索基于Elasticsearch的优化实践
美团外卖搜索工程团队在Elasticsearch的优化实践中,基于Location-Based Service(LBS)业务场景对Elasticsearch的查询性能进行优化。
Lucene源码剖析——序章
前言 有半年没写任何博客了,如果不是工作中还是碰到了非常多的挑战,我应该不会去花心思研究Lucene源码,果然DDL和困难才是第一生产力,没错,我想写一篇关于存储引擎的系列博客。 先前在创业公司工作的
Elasticsearch面试题(2021最新版)
前言 随着企业对近实时搜索的迫切需求,Elasticsearch 受到越来越多的关注,无论是阿里、腾讯、京东等互联网企业,还是平安、顺丰等传统企业都对 Elasticsearch 有广泛的使用,但是在
2019年常见Elasticsearch 面试题答案详细解析(下)
1.Elasticsearch 是一个分布式的 RESTful 风格的搜索和数据分析引擎。 (1)查询 : Elasticsearch 允许执行和合并多种类型的搜索 — 结构化、非结构化、地理位置、度量指标 — 搜索方式随心而变。 (2)分析 : 找到与查询最匹配的十个文档是一…
Lucene源码系列(十):FST构建
背景 我们都知道检索引擎的核心是倒排,倒排就是term所在的文档列表(当然可以包含term在对应文档中的详细位置信息),但是怎么通过term来定位其倒排数据呢?这个问题的本质就是term映射倒排位置的
从源码看 Lucene 的文档写入流程
在阅读源码前,这里先对源码中比较重要、常用的几个类做一个简单介绍,以便有一个初步概念,更容易的理解整个流程。
Lucene源码系列(二十):正排索引文件构建
背景 Lucene中根据term字典和倒排可以快速查找到相关文档的id,那怎么获取文档中的字段内容呢,这就是我们今天要讲的正排数据。
详解快速选择算法(Lucene实现源码分析)
计算集合中第k大(小)的元素. 就是topK相关系列的问题,但是选择算法只需要找到第k个就好. 定义的接口除了选择还有交换. Lucene对于选择算法有两个实现,快速选择算法及基数选择算法.本文将详细分析快速选择算法的源码. 该类的路径是: org.apache.lucene.…
lucene系列(三)DirectWriter源码分析
本文学习下 Lucene 在存储大量整数时使用到的编码方法。 DirectWriter 用 bit 编码方式进行数组压缩的功能,它在整个数组的所有元素都不大的情况下能带来不错的压缩效果。 DirectWriter 是 Lucene 为整型数组重编码成字节数组的工具,它的底层包含…