Elasticsearch版本升级内容

304 阅读1分钟

1. 新特性 5.x

  • Lucene 6.x,性能提升,默认打分机制从TF-IDF改为BM 25

  • 支持Ingest节点/Painless Scripting/Completion suggested 支持/原生Java Rest客户端

  • Type标记成deprecated,支持Keyword类型

  • 性能优化

    • 内部引擎移除了避免同一文档并发更新的竞争锁,带来了15%~20%的性能提升

    • Instant aggeregation,支持分片上聚合的缓存

    • 新增Profile API

2.新特性 6.x

  • Lucene 7.x

  • 新功能

    • 跨集群负责(CCR)

    • 索引生命周期管理

    • SQL的支持

  • 更友好的升级及数据迁移

    • 在主要版本之间的迁移更为简化,体验升级

    • 全新的基于操作的数据复制框架,更加快的恢复数据

  • 性能优化

    • 有效存储稀疏字段的新方法,降低了存储成本

    • 在索引时进行排序,可加快排序的查询功能

新特性7.x

  • Lucene 8.0

  • 重大改进 - 正式废除单个索引下多Type的支持

  • 7.1版本开始,Security功能免费使用

  • ECK-Elasticsearch Operator on Kubernetes

  • 新功能

    • New Cluster coordintation

    • Feature-Complete High Level REST Client

    • Script Score Query

    • 内置jdk环境

  • 性能优化

    • 默认的Primary Shard 数从5改为了1,避免Over Sharding

    shard也是一种资源,shard过多会影响集群的稳定性。因为shard过多,元信息会变多,这些元信息会占用堆内存。shard过多也会影响读写性能,因为每个读写请求都需要一个线程。所以如果index没有很大的数据量,不需要设置很多shard。

    • 性能优化,更快的TOP K