一本书的故事《搜索架构之道:App中的搜索系统设计与优化实践》-微信读书中的热门划线(第三章)

53 阅读4分钟

《搜索架构之道:App中的搜索系统设计与优化实践》在今年一月初上架微信读书,2月2日偶然发现有一位读者已经把整本书读完,并在微信读书中对本书进行了评论及推荐(感兴趣的话,可自行打开微信读书,搜索“搜索架构之道”查看^L^)。

点击进入京东查看《搜索架构之道:App中的搜索系统设计与优化实践》

点击进入当当查看《搜索架构之道:App中的搜索系统设计与优化实践》

趁着这假期还有些时间,把微信读书中这本书中的热门划线整理了一下,在这里分享给大家,整体上会分为13篇(每一章中的热门划线对应着一篇,每个热门划线会增加我对该热门划线的注解),本篇的内容为本书的第三章中的热门划线,内容与搜索服务有关,更多的热门划线,请到微信读书中,搜索“搜索架构之道”查看。

一本书的故事《搜索架构之道》在微信读书中的热门划线(第一章)

一本书的故事《搜索架构之道》-微信读书中的热门划线(第二章)

01.搜索引擎有3个最主要的指标--全、快、准。

注解:在用户检索的阶段,快和准是核心的指标。在内容的收集的阶段,全和快是两个核心的指标。内容生态是搜索引擎最基础且必要的一环,有内容生态才会有搜索生态。对于爬虫来讲,既要覆盖较广的内容,同样对时效性效高的内容也要较快抓取。

图片

02.搜索引擎是一个比较庞大的系统,在这个系统中,通常以网页的形式为用户提供内容检索服务。

注解:搜索产品没有客户端,用户也可以使用浏览器直接加载搜索引擎主页来使用搜索服务。从现状来看,网页方式承载内容可以使检索到的内容更 全,搜索产品的客户端的最大优势就是与浏览器对比的优势。

图片

03.客户端:展现加载态,页面加载过程为用户指示,避免用户等待时间过长,误以为无响应的情况发生。

注解:主要为通过视觉反馈降低用户焦虑,提升等待容忍度。这是在间接的让用户感觉 快 一些

图片

04.检索服务端:对用户输入的搜索关键字进行容错处理,得出用户有可能想要输入的内容,这一步也有可能不需要,当用户输入的都是没有歧义的搜索关键字时。

注解:中文输入的方式有多种,平饶舌(平卷舌)、同音不同字、相似字等。提升用户输入的内容的准确度,就是在提升搜索的 准 这个指标。在客户端中,搜索建议就是一种很好的辅助优化 用户输入更准的方法。 图片

05.搜索前端:结构化数据产品化封装,将搜索结果,按照可展现可交互的格式进行封装,对于浏览器产品通常是网页,对于自有客户端即可以是网页格式,也可以是自定义的格式。

注解:搜索前端是搜索客户端打交道最多的服务端,既支持搜索客户端,也支持浏览器。是搜索客户端实现差异化定制的关键依赖,既影响 快、一些内容也会影响到全 和 准。 图片

06.如果同一个站点下的多个页面在同一时间段内出现异常行为,这可能意味着该站点或其子路径出现了异常,如图3-12所示,服务端可通过多方的信息确定站点或页面存在异常。

注解:大部分是来自于第三方站点,为了确保为用户检索到的结果的有效性,需要关注内容的有效性(可用性),当有搜索客户端,即可以通过客户端加载页面的状态和云计算来确定页面有效,从而更新该站点在搜索引擎中的数据或结果权重的信息,降低无效页面的权重。这间接的也在解决 准的问题。图片

如您对这本书感兴趣,下面为这本书的详细信息。

点击进入京东查看《搜索架构之道:App中的搜索系统设计与优化实践》

点击进入当当查看《搜索架构之道:App中的搜索系统设计与优化实践》

一本书的故事(送给我在百度的这13年)**