这是我参与「第三届青训营 -后端场」笔记创作活动的第1篇笔记,搜索引擎是互联网发展的一门检索技术,旨在方便用户提升用户的访问速度,实现用户的交互性,其主要的工作原理是,利用爬虫技术,网页处理技术,大数据处理技术等方法,从互联网上搜寻信息,在对信息进行处理后,为用户提供相应的检索服务,随着互联网的发展,如今的搜索引擎大致被分为全文搜索引擎、元搜索引擎、垂直搜索引擎和目录搜索引擎等四大类。它们各有特点并适用于不同的搜索环境。对于全文搜索引擎而言,其工作原理是利用爬虫程序抓取互联网上所有相关文章予以索引,虽然它容易获得所有相关信息。但搜索到的信息过于庞杂,因此用户需要逐一浏览并甄别出所需信息。尤其在用户没有明确检索意图情况下这种搜索方式非常有效;元搜索引擎是基于多个搜索引擎结果并对之整合处理的二次搜索方式,它的搜索方式指在对网站内信息整合处理并分目录呈现给用户,但其缺点在于用户需预先了解本网站的内容,并熟悉其主要模块构成。总而观之,目录搜索方式的适应范围非常有限,且需要较高的人工成本来支持维护。通常使用于广泛、准确地收集信息。垂直搜索引擎是对某一特定行业内数据进行快速检索的一种专业搜索方式;目录搜索引擎是依赖人工收集处理数据并置于分类目录链接下的搜索方式。随着时代的发展,搜索引擎已经发展成为根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统,成为用户在使用过程中不可或缺的内容之一。\