历经三年,Elastic 8.0 正式发布

4,208

2月11日,Elastic官方博客发文宣布Elastic 8.0在Elastic Cloud上正式可用。这是唯一一个包含最新版本中所有新功能的Elasticsearch托管产品。

新时代:速度、规模和相关性

随着我们迈入2022年,Elastic 也迈入了速度、规模和相关性的新时代。每一个Elastic版本都有增强和优化这三个特性,以确保Elasticsearch是最快速、最可扩展、最强大的搜索引擎。

过去三年中,Elastic在以下方面取得了巨大进步:减少内存的使用(允许每个节点管理更多的数据),减少查询的开销(尤其是对大型部署的影响),并引入一些全新的功能来提高相关性。

随着7.x版本的发布,提高了日期柱状图搜索聚合的速度,增强了页面缓存的性能,并创建了一个新的"预过滤 "搜索阶段。此外,通过减少内存堆, 完全支持ARM架构,引入新的方法来减少存储, 客户能够通过新的冻结层和可搜索的快照轻松地将计算与存储分离,从而降低了资源需求。

用原生矢量搜索提高搜索的相关性

Elastic 8.0带来了一整套原生矢量搜索功能,开发者能够使用自己的语言和文字进行搜索并收到高度相关的结果。

在过去的两年里,Elasticsearch一直在积极尝试矢量搜索。早在Elasticsearch7.0发布时,就为高维向量引入了字段类型。在Elasticsearch 7.3Elasticsearch 7.4中,引入了对向量相似性函数的支持。这些早期版本展示了将矢量搜索技术引入Elasticsearch生态系统的前景。

在Elasticsearch 8.0中,Elasticsearch引入了自然语言处理(NLP)模型的本地支持,使矢量搜索更加实用。此外,Elasticsearch 8.0还包括对ANN搜索的本地支持,使基于矢量的查询与基于矢量的文档库进行快速和大规模的比较成为可能。

用NLP的力量开辟一个新的分析世界

Elasticsearch一直NLP的土壤,但之前NLP需要在Elasticsearch之外做一些处理,或编写一些相当复杂的插件。

在8.0版本中,用户现在可以直接在Elasticsearch进行命名实体识别、情感分析、文本分类等,而不需要额外的组件或编码。在Elasticsearch内部计算和创建向量,不仅在横向可扩展性方面是一个 "胜利"(通过在服务器集群中分布计算),这一变化也为Elasticsearch用户节省了大量的时间和精力。

借助 Elastic 8.0,用户可以直接在 Elasticsearch 中使用 PyTorch 机器学习模型(例如 BERT),并在 Elasticsearch 中使用这些模型进行推理。这些模型可以是自定义模型,也可以是在Hugging Face等存储库中发布到社区的模型。

用户直接在 Elasticsearch 中执行推理,将现代 NLP 的强大功能集成到搜索应用程序和体验,用户不需要将数据移出到单独的进程或系统中,NLP变得更高效。

快速搜索,大规模搜索

鉴于 Elastic 8.0 基于 Lucene 9.0,利用现代 NLP 的搜索体验可以通过对ANN搜索的原生支持,快速、大规模地实现这一目标。ANN 可以快速有效地将基于向量的查询与基于向量的文档语料库是进行比较。

对于NLP和ANN的支持还只是开始。未来,搜索驱动的解决方案(如 Elastic Enterprise Search)将使利用矢量搜索的强大功能变得非常简单。

通过两个新的 Amazon Web Services 集成简化云原生可观察性

在过去的版本中,简化了从任何来源将任何类型的数据获取到 Elastic Stack 的过程。借助 Elastic 8.0,可以通过两个新的 AWS 集成进一步扩展了云原生集成,即一个新的 AWS Lambda 应用程序和一个新的 Amazon Simple Storage Service (Amazon S3) Storage Lens 集成。

在 AWS Serverless Application Repository (SAR) 中发布的新 AWS Lambda 应用程序(测试版)使用户能够简化其架构并简化数据摄取,而无需预置虚拟机或安装数据传送器的开销。简而言之,用户现在只需在 AWS 控制台中单击几下,即可将来自 Amazon S3 的日志提取到 Elastic Cloud 部署中。

借助 Elastic于 12 月首次宣布的 Amazon S3 Storage Lens 集成,用户可以轻松地将 Storage Lens 指标传送到 Elastic Cloud 部署中,使用 Elasticsearch 强大的搜索和分析功能以及 Kibana 强大的仪表板功能来优化 Amazon S3 使用成本,确保数据保护,并监控用户活动趋势。

通过简化的堆栈安全性保护数据免受未经授权的访问

安全性变得越发重要。在 Elastic 8.0 中,现在默认为自管理集群启用安全性,确保数据、网络和用户在 Elastic Stack 中得到保护,防止数据泄露和未经授权的访问。借助自动生成的令牌和证书等产品内帮助,简化过程,节省时间和精力,让所有人都能获得安全性。