1.全文检索

138 阅读3分钟

全文检索是计算机程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置。当用户查询时根据建立的索引查找,类似于通过字典的检索字表查字的过程。

索:建立索引 文本->切分->词 文章出现过 出现多少次

检索:查询 关键字->索引中->符合条件文章 相关度排序

全文检索(Full-Text Retrieval)以文本作为检索对象,找出含有指定词汇的文本。全面、准确和快速是衡量全文检索系统的关键指标。

  • 只处理文本、不处理语义(例如查询今天几号?不会处理!)
  • 搜索时英文不区分大小写(例如百度和谷歌查询自动忽略大小写)
  • 结果列表有相关度排序(例如从前到后,前面最匹配)

简介

什么是ElasticSearch

ElasticSearch简称 ES,是基于Apache Lucene构建的开源搜索引擎,是当前最流行的企业级搜索引擎。Lucene本身就可以被认为迄今为止性能最好的一款开源搜窦引擎工具包,但是lucene的API相对复杂,需要深厚的搜索理论。很难集成到实际的应用中去。ES是采用java语言编写,提供了简单易用的RestFul API,开发者可以使用其简单的RestFul API,开发相关的搜索功能,从而避免lucene的复杂性。

简单使用

jps(Java Virtual Machine Process Status Tool)是JDK提供的一个可以列出正在运行的Java虚拟机的进程信息的命令行工具,它可以显示Java虚拟机进程的执行主类(Main Class,main()函数所在的类)名称、本地虚拟机唯一ID(LVMID,Local Virtual Machine Identifier)等信息。另外,jps命令只能显示它有访问权限的Java进程的信息。 juejin.cn/post/707406…

通过查看进程的方式看es是否运行

PS D:\elasticsearch-8.10.2> jps
3392 CliToolLauncher
23556 Jps
12920 org.elasticsearch.bootstrap.Elasticsearch

调用

curl http://localhost:9200

以后台方式启动es

./elasticsearche -d

关闭后台中的es

kiil [pid]

远程连接

es默认以集群的方式启动

  1. 将config/elasticsearch.yml中的host改为0.0.0.0
  2. 最好再设置一下内存占用大小,不然机器会运行错误

Kibana

简介

Kibana是一个针对Elasticsearch的开源分析及可视化平台,使用Kibana可以查询、查看并 与存储在ES索引的数据进行交互操作,使用Kibana能执行 高级的数据分析,并能以图表、表格和 地图的形式查看数据。

ES全文检索服务 分布式搜索引擎服务视化客户端工具
Restful的 APIPostman
kibana(推荐,展示更详细)

安装

  1. [Download Kibana Free | Get Started Now | Elastic](www.elastic.co/cn/download…
  2. Start the Elastic Stack with security enabled automatically | Elasticsearch Guide [8.10] | Elastic
# 编辑配置文件config/kibana.yml
# 进行如下修改(默认是注释的,需要去掉注释)
# 开启远程服务
# server.host: "0.0.0.0"
# ES服务器地址
# elasticsearch.hots: ["http://localhost:9200"]

更多可参考Kibana详细入门教程 - 雪山飞猪 - 博客园 (cnblogs.com)