简述: 搜索引起是根据一定的策略、运用特定的计算机程序从互联网上收集信息。在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。
搜索引擎有几种?
搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。
以全文索引为例:
首先要进行数据库中数据的搜索,搜索引擎的自动信息搜集方式分为两种。
- 一是定期搜索:每隔一段时间,搜素引擎主动进行爬虫程序,对一定 IP 地址范围内的互联网网站进行检索,一旦发现新的网站,就会自动提取网站的信息和网址加入数据库。
- 二是提交搜索:网站所有者主动提交网址,在一定时间内搜索引擎会对你的网站进行爬虫,扫描你的网站并将有关信息存入数据库,以备查询。
当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,就采用特殊的算法(计算网页中关键词匹配程度、出现的位置、频次、链接质量等)计算出各网页的相关度及排名等级,然后根据关联程度,顺序返回给用户。
搜索引擎能解决什么问题?
- 高效查询数据
- 易实现
- 大数据量、时效性、高并发
搜索引擎的应用场景
- 数据库达到百万数据级别的时候
- 要求检索时效性、性能要求高、Ms 级响应
引用