【搜索引擎的设计与实现——开题报告 分享(仅供参考呀)】,建议收藏

87 阅读6分钟

最后

如果你已经下定决心要转行做编程行业,在最开始的时候就要对自己的学习有一个基本的规划,还要对这个行业的技术需求有一个基本的了解。有一个已就业为目的的学习目标,然后为之努力,坚持到底。如果你有幸看到这篇文章,希望对你有所帮助,祝你转行成功。

开源分享:docs.qq.com/doc/DSmRnRG…

一、课题背景


随着互联网的快速发展,越来越丰富的信息呈现在用户面前,但同时伴随的问题是用户越来越难以获得其最需要的信息。为了解决此问题,出现了网络搜索引擎。网络搜索引擎中以基于WWW的搜索引擎应用范围最为广泛。网络搜索引擎是指对WWW站点资源和其它资源进行索引和检索的一类检索机制。全文搜索引擎是目前最为普及的应用,通过从互联网上提取各个网站的信息(以网页文字为主)建立数据库,用户查询的时候便在数据库中检索与用户查询条件相匹配的记录,最终将匹配的那些记录,按一定的排列顺序显示给用户。国外具代表性的全文检索搜索引有Google、Yahoo、Bing等 ,国内著名的有百度、360等。

目前网络资源是非常丰富,但是怎样有效的搜索信息却是一件困难的事情。研究搜索引擎就成了解决这个问题行之有效的方法。该课题要求设计一个web应用程序,学习搜索引擎的基本原理和设计方法,应用开元的全文搜索引擎Lucene框架和Lucene的子项目Nutch实现一个全文搜索引擎。

二、课题研究目的


针对搜索引擎广阔的应用前景以及分析国内外搜索引擎的发展现状,根据搜索引擎系统的工作原理设计一种基于网络的全文搜索引擎模型,它从网络上获取信息,建立索引数据库,并采用数据库管理作业及多线程技术来提高全文搜索的性能和效率,从技术上可以适用于任何有全文搜索需求的应用。

三、主要研究和设计内容


一般来说搜索引擎都由:用户接口、搜索器、索引生成器和查询处理器4个部分组成。

(1)用户接口:

用户接口的作用是输入用户查询、显示查询结果、提供用户相关性反馈机制。主要的目的是方便用户使用搜索引擎,高效率、多方式地从搜索引擎中得到有效、及时的信息。用户接口的设计和实现使用人机交互的理论和方法,来充分适应人类的思维习惯。

(2)搜索器:

用于WWW的遍历和网页的下载。从一个起始URL集合开始,顺着这些URL中的超链(Hyperlink),以宽度优先、深度优先或启发式方式循环地在互联网中发现信息。

(3)索引生成器:

对搜索器收集到的网页和相关的描述信息经索引组织后存储在索引库中。

(4)查询处理器:

检索器的功能是根据用户的查询在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制。

本人独立进行全文搜索引擎的开发和设计工作,包括相关程序的编写、界面的设计、调试工作等等。

四、论文实施计划


各阶段任务安排:毕业设计时间XXXX/2/20–XXXX/5/30

1-3周:收集、整理、阅读、分析相关资料,撰写并提交开题报告、文献综述。同时开始进行外文翻译等工作。

4-6周:在理解系统需求的基础上对掌握的资料进行归纳总结,编写需求说明文档和设计方案,并进行设计;撰写并提交外文翻译文档。

7-11周:系统设计、实现、测试。

12周:在系统设计完成的基础上进行论文初稿撰写的有关工作。

13周:论文定稿。

14周:论文答辩。

五、参考文献:


[1]陈立.全文检索引擎的设计研究[J].现代情报,2007(10):56~58. [2]蔡建超,郭一平,王亮.基于Lucene.Net校园网搜索引擎的设计与实现[J].计算机技术与发展,2006(11):80~82.

[3]张校乾,金玉玲,侯玉波.一种基于Lucene检索系统的全文数据库的设计与实现[J].现代图书情报技术,2005(2):77~79.

[4]车东.在应用中加入全文检索功能——基于Java的全文索引引擎Lucene简介[EB/OL],2002-08.www.chcdong.com/tech/lucene….

[5]陈烨彬,黄琳.基于Lucene.Net的知识检索系统的设计与实现[J].开发案例,2008(11):74~76.

[6]刘磊安,符志强.基于Lucene.Net网络爬虫的设计与实现[J].电脑知识与技术,2010(8):46~48.

[7]李文江,陈诗琴.基于Lucene.net全文检索在文档管理中的应用[J].现代图书情报技术,2010(11):50~52.

[8]杨文刚.基于Lucene.net的档案垂直搜索引擎的实现[J].北京档案,2012(10):88~89.

[9]蓝滨,王征.基于ASP.NET搜索引擎研究与实现[J].硅谷,2012(23):43~45.

[10]邹燕飞,于成尊,赵亮.基于Lucene的文本搜索引擎的设计和实现[J].计算机与现代化,2011(9):23~25.

[11]吕双,王小科.C#程序开发范例宝典[M].北京:人民邮电出版社,2009(10):50~322.

[12]宋华,现代物流成本的系统管理与控制[J].经济管理,2004(11):56~57.

基础面试题

开源分享:【大厂前端面试题解析+核心总结学习笔记+真实项目实战+最新讲解视频】

主要内容包括:HTML,CSS,JavaScript,浏览器,性能优化等等