Elasticsearch版本升级内容

2021-07-14 304 阅读1分钟

1. 新特性 5.x

Lucene 6.x，性能提升，默认打分机制从TF-IDF改为BM 25
支持Ingest节点/Painless Scripting/Completion suggested 支持/原生Java Rest客户端
Type标记成deprecated,支持Keyword类型
性能优化
- 内部引擎移除了避免同一文档并发更新的竞争锁，带来了15%~20%的性能提升
- Instant aggeregation,支持分片上聚合的缓存
- 新增Profile API

2.新特性 6.x

Lucene 7.x
新功能
- 跨集群负责（CCR）
- 索引生命周期管理
- SQL的支持
更友好的升级及数据迁移
- 在主要版本之间的迁移更为简化，体验升级
- 全新的基于操作的数据复制框架，更加快的恢复数据
性能优化
- 有效存储稀疏字段的新方法，降低了存储成本
- 在索引时进行排序，可加快排序的查询功能

新特性7.x

Lucene 8.0
重大改进 - 正式废除单个索引下多Type的支持
7.1版本开始，Security功能免费使用
ECK-Elasticsearch Operator on Kubernetes
新功能
- New Cluster coordintation
- Feature-Complete High Level REST Client
- Script Score Query
- 内置jdk环境
性能优化
- 默认的Primary Shard 数从5改为了1，避免Over Sharding
shard也是一种资源，shard过多会影响集群的稳定性。因为shard过多，元信息会变多，这些元信息会占用堆内存。shard过多也会影响读写性能，因为每个读写请求都需要一个线程。所以如果index没有很大的数据量，不需要设置很多shard。
- 性能优化，更快的TOP K