基于Java学院网站的搜索引擎(Java 爬虫 搜索引擎)设计和实现

698 阅读1分钟

这是我参与更文挑战的第3天,活动详情查看:更文挑战

对学院网站进行抓取、建索、排序、搜索、摘要显示。是Web界面。

首先利用httpclient+多线程去模拟客户端去进行获取网页的内容,然后采用jsoup+多线程来进行解析网页内容并存储本地

项目主要使用技术

Httplcient
Jsoup
多线程
数据库dao模式
IKAnanyzer
Lucene
Javascript /jQuery
Bootstrip
Web

这是从网页抓取数据,保存在本地运行程序main方法建立索引

运行Java程序 启动Tomcat 访问页面输入关键字就可以进行搜索

 

 

好了,今天就到这儿吧,小伙伴们点赞、收藏、评论,一键三连走起呀,下期见~~