《搜索架构之道:App中的搜索系统设计与优化实践》在今年一月初上架微信读书,2月2日偶然发现有一位读者已经把整本书读完,并在微信读书中对本书进行了评论及推荐(感兴趣的话,可自行打开微信读书,搜索“搜索架构之道”查看^L^)。 点击进入京东查看《搜索架构之道:App中的搜索系统设计与优化实践》
点击进入当当查看《搜索架构之道:App中的搜索系统设计与优化实践》
趁着这假期还有些时间,把微信读书中这本书中的热门划线整理了一下,在这里分享给大家,整体上会分为13篇(每一章中的热门划线对应着一篇,每个热门划线会增加我对该热门划线的注解),本篇的内容为本书的第七章中的热门划线,内容与安全有关,包括网络通信安全、网页浏览安全、自有服务安全、用户信息安全、技术复用安全等,更多的热门划线,请到微信读书中,搜索“搜索架构之道”查看。
一本书的故事《搜索架构之道》在微信读书中的热门划线(第一章)
一本书的故事《搜索架构之道》-微信读书中的热门划线(第二章)
一本书的故事《搜索架构之道》-微信读书中的热门划线(第三章)
一本书的故事《搜索架构之道》-微信读书中的热门划线(第四章)
一本书的故事《搜索架构之道》-微信读书中的热门划线(第五章)
一本书的故事《搜索架构之道》-微信读书中的热门划线(第六章)
01.当用户有搜索需求时,首先打开搜索客户端,再进行相关的功能操作,这时客户端是与用户会话的第一层,也是离用户最近的一层。
注解:用户在有搜索需求时,会打开浏览器或搜索App,一些用户在使用搜索服务时,所看到的一些有困扰的内容会认为这是搜索服务产生的。实际上在用户搜索及浏览网页这其间会受到很多因素的影响,比如第三方页面,当前网络状态,引入的第三方库等。如果使用搜索App更是容易被误解,同样这些内容在搜索App中浏览时更容易被识别及干预。
02.客户端不仅可以与用户进行会话, 还能够响应用户的需要,并处理与服务端通信传输业务相关的数据。
注解:客户端是整个搜索服务与用户交互的门面,是搜索服务的输入、输出层和部分的逻辑处理层,与服务端交互频繁。安全问题在不同的环节都有可能产生,也会受到其它协同方的影响,并在客户端中表现。故搜索客户端需要关注安全问题,并解决。
03.在网页爬虫抓取网页内容并收录到 搜索引擎的数据库之后,如果这个 网页的内容产生了变更,但更新的 内容还没有被收录到搜索引擎的数据库时,用户搜索与原网页内容相 关的关键字,这个网页就会被检索 到并出现在搜索结果页中,这时搜 索结果页中的摘要信息依然是这个 网页被收录时的内容,但当用户点 击这个结果条目进入页面时,实际看到的是更新之后的网页。
注解:同一个页面入库的网页内容是A,用户看到的可能是A‘,这即有可能是页面本身的变动,也有可能是数据传输过程的产生的变动。这种情况搜索引擎识别的成本极高(部分情况存在无法识别),故存在这些安全问题,但如果有搜索客户端,因为展示的实际内容,部分可以通过技术手段来识别。
04.域名解析安全问题主要发生在域名解析阶段,其表现为将请求的域名IP地址解析为错误的IP地址。
注解:常用的技术手段是HTTPDNS,当有自有搜索客户端,且浏览内核的网络可接管时(本系列的第5章有介绍),该技术手段则可以在App中的不同内容的通信时使用,解决域名解析安全问题。
05.在客户端中,主要构建识别安全状态的能力、干预不安全内容加载或展现的能力、识别效果及干预效果统计的能力等。
注解:因为客户端展现的是当前最真实内容,这时安全问题已经产生。如需要干预,则需要先识别。同一个安全问题不一定是所有用户都会遇到,与地域、网络状态(运营商)、设备等因素有关,且存在变种,需要持续的关注、分析、识别及干预。06.对于自有客户端来说,端云协同可以实现一些功能的定制,这些定制仅在自有客户端中生效。
注解:举个容易想到的点,如果有搜索客户端,可及时地发现一些不安全的内容,这些内容可以影响搜索结果的排序。07.也就是说,安全策略在早期的版本没有建立,如果这些版本还有一些用户在使用,那就说明这个服务需要存在,安全隐患也就存在。
注解:在安全机制建立前App发布的版本是没有安全相关能力的。同时为了支持这些版本的App正常运行,云端为了兼容,安全问题也会暴露出来(比如通信数据没有加密,网页内容不区分浏览器或自有客户端),隐患也自然存在。
如您对这本书感兴趣,下面为这本书的详细信息。
点击进入京东查看《搜索架构之道:App中的搜索系统设计与优化实践》