ElasticSearch基础

71 阅读2分钟

【ElasticSearch】****

elastic技术栈,完整的技术栈包括:- Elasticsearch:用于数据存储、计算和搜索。- Logstash/Beats:用于数据收集。- Kibana:用于数据可视化。整套技术栈被称为ELK,经常用来做日志收集、系统监控和状态分析。而技术栈的核心就是用来存储、搜索、计算的Elasticsearch.。

 

【倒排索引】****

正向索引 根据id精确匹配时,走索引,查询效率较高。而当搜索条件为模糊匹配时,由于索引无法生效,退化为全表扫描,效率很差。因此,正向索引不适合于根据索引字段的精确搜索,不适合基于部分词条的模糊匹配 → 倒排索引。

【倒排索引概念】

  • 文档(Document):用来搜索的数据,其中的每一条数据就是一个文档。例如一个 网页 或商品信息。

  • 词条(Term):对文档数据或用户搜索数据,利用某种算法分词,得到的具备含义的词语就是词条。

【创建倒排索引的流程】

  • 将每一个文档的数据利用分词算法根据语义拆分,得到一个个词条。

  • 创建表,每行数据包括词条、词条所在文档id、位置等信息。

  • 据词条唯一性,给词条创建正向索引。

【区别】

  •  正向索引是最传统的,根据id索引的方式。但根据词条查询时,必须先逐条获取每个文档,然后判断文档中是否包含所需要的词条,是根据文档找词条的过程。

  •  而倒排索引则相反,是先找到用户要搜索的词条,根据词条得到保护词条的文档的id,然后根据id获取文档。是根据词条找文档的过程。

 

【ElasticSearch基本概念】VS MySql 。文档,字段,索引,映射。

MySQLElasticsearch说明
TableIndex索引(index),就是文档的集合,类似数据库的表(table)
RowDocument文档(Document),就是一条条的数据,类似数据库中的行(Row),文档都是JSON格式
ColumnField字段(Field),就是JSON文档中的字段,类似数据库中的列(Column)
SchemaMappingMapping(映射)是索引中文档的约束,例如字段类型约束。类似数据库的表结构(Schema)
SQLDSLDSL是elasticsearch提供的JSON风格的请求语句,用来操作elasticsearch,实现CRUD

特长:

  •  Mysql:擅长事务类型操作,可以确保数据的安全和一致性

  •  Elasticsearch:擅长海量数据的搜索、分析、计算

使用场景:

  • 对安全性要求较高的写操作,使用mysql实现

  • 对查询性能要求较高的搜索需求,使用elasticsearch实现

  • 两者再基于某种方式,实现数据的同步,保证一致性