【ElasticSearch】****
elastic技术栈,完整的技术栈包括:- Elasticsearch:用于数据存储、计算和搜索。- Logstash/Beats:用于数据收集。- Kibana:用于数据可视化。整套技术栈被称为ELK,经常用来做日志收集、系统监控和状态分析。而技术栈的核心就是用来存储、搜索、计算的Elasticsearch.。
【倒排索引】****
正向索引 根据id精确匹配时,走索引,查询效率较高。而当搜索条件为模糊匹配时,由于索引无法生效,退化为全表扫描,效率很差。因此,正向索引不适合于根据索引字段的精确搜索,不适合基于部分词条的模糊匹配 → 倒排索引。
【倒排索引概念】
-
文档(Document):用来搜索的数据,其中的每一条数据就是一个文档。例如一个 网页 或商品信息。
-
词条(Term):对文档数据或用户搜索数据,利用某种算法分词,得到的具备含义的词语就是词条。
【创建倒排索引的流程】
-
将每一个文档的数据利用分词算法根据语义拆分,得到一个个词条。
-
创建表,每行数据包括词条、词条所在文档id、位置等信息。
-
据词条唯一性,给词条创建正向索引。
【区别】
-
正向索引是最传统的,根据id索引的方式。但根据词条查询时,必须先逐条获取每个文档,然后判断文档中是否包含所需要的词条,是根据文档找词条的过程。
-
而倒排索引则相反,是先找到用户要搜索的词条,根据词条得到保护词条的文档的id,然后根据id获取文档。是根据词条找文档的过程。
【ElasticSearch基本概念】VS MySql 。文档,字段,索引,映射。
| MySQL | Elasticsearch | 说明 |
|---|---|---|
| Table | Index | 索引(index),就是文档的集合,类似数据库的表(table) |
| Row | Document | 文档(Document),就是一条条的数据,类似数据库中的行(Row),文档都是JSON格式 |
| Column | Field | 字段(Field),就是JSON文档中的字段,类似数据库中的列(Column) |
| Schema | Mapping | Mapping(映射)是索引中文档的约束,例如字段类型约束。类似数据库的表结构(Schema) |
| SQL | DSL | DSL是elasticsearch提供的JSON风格的请求语句,用来操作elasticsearch,实现CRUD |
特长:
-
Mysql:擅长事务类型操作,可以确保数据的安全和一致性
-
Elasticsearch:擅长海量数据的搜索、分析、计算
使用场景:
-
对安全性要求较高的写操作,使用mysql实现
-
对查询性能要求较高的搜索需求,使用elasticsearch实现
-
两者再基于某种方式,实现数据的同步,保证一致性