一篇文章,彻底弄懂ES

0 阅读2分钟

ES优势:横向可扩展性、伸缩性:只需要增加一台服务节点,更改配置,启动一下ES进程即可并入集群。

分片机制提供更好的分布性:同一个索引分成多个分片(sharding),分片均匀分布到每台机器节点,很好的实现了分布式数据存储。当我们的集群扩容或缩小,ES将会自动在你的节点空间进行分片迁移,以使集群保持平衡。

高可用:提供复制(replica)机制,一个分片可以设置多个复制,使得某台服务器宕机的情况下,集群仍旧可以照常运行,并会把由于服务器宕机丢失的复制恢复到其它可用节点上。

 

ES索引排序方式:ES索引排序方式采用了一种倒排索引的结构,它适用于快速的全文搜索,一个倒排索引由文档中所有不重复词的列表构成,对于其中每个词,有一个包含它的文档列表。可以理解成一种字典中根据字(词条)找到对应的页码(文档):示例图:

image.png ES分片和副本的关系:

image.png  

分片和副本的分配策略:不使用默认的es分片配置(默认5个分片),一般以(节点数*1.5或3倍)来计算,比如有4个节点,分片数量一般是6个到12个,每个分片一般分配一个副本,分片过多会消耗文件句柄, 内存和CPU资源,单节点分片过多会存在硬件资源竞争,过少会影响es的横向扩展能力

分词器:分词是将文本转换成一系列单词的过程,也可以叫文本分析。