ITrip项目(5)Solr环境搭建

384 阅读2分钟

一、Solr简介及服务搭建

搜索引擎运行原理: Solr是基于Lucene[ˈluːsin]的Java搜索引擎服务器程序

Solr功能:

数据导入
增量更新
数据检索(全文检索,高亮显示,精确搜索)

1、Solr的安装 (查阅solr技术分析与应用)

官网下载solr4.9.1的程序安装包。 下载地址:http://archive.apache.org/dist/lucene/solr/  

将dist\solr-4.9.1.war文件复制到tomcat的webapps目录下,并将文件命名为solr.war  

复制 solr解压包下example\lib\ext 下所有的jar 到tomcat 的lib目录下   

在计算机本地新建一个文件夹solr_home(可以随便起名字), 然后复制 solr-4.9.1\example\solr 下的所有文件到 solr_home下 

启动tomcat,待tomcat启动成功后,关闭tomcat。打开tomcat的webapps目录,
注意此时solr的war包以及被解压成solr文件夹,删除tomcat 的webapps目录下的solr的war 包,保留solr文件夹

修改配置文件 apache-tomcat-7.0.67\webapps\solr\WEB-INF\web.xml
<env-entry> 
	<env-entry-name>solr/home</env-entry-name> 
	<env-entry-value> D:/solr_home</env-entry-value> 
	<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
访问solr(http://localhost:端口号/solr/),如出现以下界面则solr部署成功。

2、新建数据配置 core —>新增数据库配置—>将数据库的数据导入到solr当中

3、配置增量更新
配置solr的增量更新, 即定时将数据库的数据导入到solr中,实现同步功能。

将资料中提供的apache-solr-dataimports-cheduler.jar包添加至solr的lib目录下  

增加增量更新配置文件,在solr_home文件夹下新建conf文件夹,并新建名为dataimport.properties的配置文件

新增增量更新数据的监听器,在solr的web.xml中加入以下监听器

在data-config.xml文件里修改导入数据查询SQL

启动Tomcat进行测试

4、配置分词器
分词器是从用户输入的一段文本中提取关键词,用于其它业务操作。
常见的 Java 分词器:

word 分词器、Ansj 分词器、Stanford 分词器、IKAnalyzer 分词器 

IK 分词器下载地址: download.csdn.net/download/tj… 5、solr 基本查询语法
6、solr 多字段匹配
针对关键词多字段的搜索,solr中提供了相应的检索机制。 在hotel/conf/schema.xml文件中新增filed字段存储多字段的值

<field name="keyword" type="text_ik" indexed="true" stored="true" multiValued="true"/> 
<copyField source="hotelName" dest="keyword"/>
<copyField source="address" dest="keyword"/>

重新执行数据导入,并利用关键词搜索
以上我们已经成功的搭建了solr的服务,下面将solr服务集成到我们项目当中。