Valkey 9.1 发布:内存占用降低 10%,搜索功能正式并入核心

4 阅读8分钟

\n\nValkey 9.1正式发布,通过重构数据布局在无需调优的情况下将内存占用降低10%。新版本集成了全文本及向量搜索功能,引入数据库级ACL,并利用AI代理优化开发流程。

译自:Valkey 9.1 trims memory 10% and pulls search into the core

作者:Steven J. Vaughan-Nichols

Valkey 9.1 现在已正式发布(GA),重点提升了生产工作负载的效率、模块化和生态系统工具。

在本周于明尼阿波利斯举行的 开源峰会北美站 上,Valkey 的维护者之一、AWS 首席工程师 Madelyn Olson 将宣布 Valkey 9.1 的正式发布。随之而来的还有新版本的 Valkey Admin、Valkey Search 和 Valkey GLIDE 客户端。

Redis 这一流行开源分支的最新版本 Valkey,旨在为那些在生产环境中需要“快速、可靠的数据访问且不增加基础设施成本”的组织提供服务,Madelyn Olson 表示。该版本由“领先技术提供商组成的多元化社区”开发,强调计算效率和架构模块化,认为这是分布式系统长期可持续发展的关键。

Madelyn Olson 继续说道:“我们项目的目标是确保 Valkey 在提供新功能的同时,表现得非常可预测。具体而言,我们希望维持一流的性能和效率。通过不断投入引擎的模块化,我们能够持续实现这一目标,从而支持全文本搜索等新功能。”

“……在常见工作负载下,将每个键的内存使用量降低高达 10%——无需调优,无需重新配置。”

更低内存,无需调优

Valkey 9.1 的核心是重构后的内部数据布局,旨在降低开箱即用的内存消耗。据 Madelyn Olson 介绍,新版本“重构了内部存储和管理数据的方式,在常见工作负载下将每个键的内存使用量降低了高达 10%——无需调优,无需重新配置”。对于云级部署,团队将其视为直接降低基础设施支出的杠杆,允许运营商在更少或更小的实例上运行相同的工作负载。

Madelyn Olson 承认,这些改进不像早期的 8.x 和 9.0 版本那样令人兴奋。这是因为当时 Valkey 开发人员正在向引擎中推送大量此前 Redis 未允许发布的积压功能。

数据库级 ACL 现已加入

此外,9.1 版本中的安全性变更旨在加强保护,同时最大限度地减少操作负担。该版本增加了“自动 TLS 证书重新加载和新的数据库级 ACL 系统,在单个实例内提供细粒度的多租户隔离”。数据库级 ACL 旨在允许运营商将单个 Valkey 部署划分为多个租户或应用,并实现更精确的访问控制。

该项目将这些功能定义为一种“减轻开发人员压力并提供一层保障的方式,即无论部署规模和类型如何,Valkey 都将保持稳定和安全”。Madelyn Olson 还将部分工作描述为转向“源头守卫(provenance guard)”安全功能的一部分,即利用 AI 辅助工具帮助监控整个代码库中的异常和漏洞。

响应运营商的需求,Valkey 9.1 引入了一项名为 CLUSTERSCAN 的新功能。该功能“能够在整个集群中实现一致的键扫描,这对集群运营商来说是一项福利”,他们需要对数据进行可预测的迭代,而无需求助于临时脚本或逐节点扫描。项目方表示,运营商“可以期望在重负载下获得更一致的性能,使 Valkey 成为延迟敏感、高吞吐量应用的首选数据库引擎”。

搜索加入引擎

虽然 Valkey 长期以来一直以缓存和内存数据存储著称,但本次发布周期标志着搜索功能直接整合到了同一系统中。Valkey Search 模块(现为 1.2 版本)在同一数据存储系统中提供了“全文本搜索、数值过滤、基于标签的查找以及 AI 就绪的向量搜索”。Valkey 将其描述为一种“将缓存和搜索整合到统一系统下”的方式,消除了运行和维护独立搜索平台的必要。

借助 Valkey Search,“企业可以扩展到 TB 级数据,同时在搜索、电子商务网站、实时仪表板和排行榜等用例中保持微秒级延迟和每秒高达数百万次的请求”。组织“不再需要配置或维护单独的搜索平台”,因为“缓存和搜索在单个高性能系统中共同运行,降低了运营开销和总成本”。

Madelyn Olson 强调,这些结合的能力与“智能体 AI 领域”尤为相关,开发人员在这一领域“希望拥有某种混合搜索”,将确定性的全文本查询与近似向量搜索相结合。用她的话说,模块化搜索堆栈“主要适用于”团队“希望用全文本确定性地完成部分搜索,然后用向量相似性近似完成另一部分搜索”的场景。

除了 9.1 引擎版本外,Valkey 社区还发布了 Valkey Admin 作为集群运营商的正式可用工具。Valkey Admin 最初在今年早些时候的 Unlocked 会议上亮相,被描述为“一款开源的可视化集群管理工具”,旨在让团队“实时查看其 Valkey 部署,包括集群拓扑、单节点性能和用于检查的键浏览器”。

在客户端方面,开源的 Valkey GLIDE 库已达到 2.4 版本,新功能集中在缓存和语言覆盖范围上。该项目表示,GLIDE “引入了对客户端缓存和透明缓存的支持”,并“将其语言支持扩展到了 C# 和 PHP”,将其所谓的“Valkey 生产级、原生客户端体验带到了两个最重要的企业和 Web 应用生态系统”。

GLIDE 被描述为“Valkey 的官方开源客户端库,建立在共享的 Rust 核心之上,在多种编程语言中提供一致、可靠的行为”。它“预配置了最佳实践,并自动处理集群拓扑、连接管理和请求路由,因此开发人员无需操心”。通过客户端缓存,“应用现在可以直接从本地内存提供频繁访问的数据,从而消除了冗余的网络往返,并在每秒获取同一键数千次的读密集型工作负载中减轻了服务器负载”。

对于构建分布式系统的团队,该项目声称 GLIDE 意味着“更少的事故、更快的恢复,以及一个能降低跨可用区和跨地域数据传输成本的客户端库”。在 The New Stack 的采访中,Madelyn Olson 强调 GLIDE 的 Rust 核心支撑着一系列不断增长的绑定,并表示团队“终于完成了所有语言的支持,包括 C#、PHP、Java、JavaScript、Python、Go 等,我们觉得该客户端已经真正做好了 GA 准备并可广泛使用”。

AI 代理对抗职业倦怠

在原定于周三的主演演讲中,Madelyn Olson 计划展示 Valkey 自身的开发过程如何整合 AI 代理。演讲将“概述目前如何利用 AI 代理通过自动化繁琐、耗时的任务来对抗维护者的职业倦怠”,涵盖两个主要领域:“源头守卫”安全功能,以及“整个项目中复杂的后向移植(backporting)和持续集成(CI)测试”。

在采访中,Madelyn Olson 解释说,该项目使用基于 AI 的代理来扫描代码库、尝试触发崩溃并发现漏洞,并指出其中一项努力在运行“数百小时”后“发现了大约 20 多个奇特漏洞和一个 CVE”。她表示,团队还“构建了大量基础设施来自动化后向移植”,AI 代理会尝试后向移植、运行测试套件并反复迭代直到实现干净的构建,从而“努力减少我们的工作投入”,同时对核心引擎的更改保持人工审核。

Madelyn Olson 强调,对于 Valkey 核心,“我们真的想要严格审查进入的代码”,并将 AI 描述为“另一层验证”,在快速生成实验性代码方面“非常出色”。她还补充道,我们“正在尽力确保项目仍然主要由维护者驱动,然后尽可能多地利用 AI 来帮助他们,而不是一定要取代他们”。

这一切听起来都很宏大,但人们是否买账?根据 Madelyn Olson 的说法,答案是肯定的。Madelyn Olson 指出,Valkey 目前“每周约有 600 万次容器拉取”,而 Redis 大约是“2400 到 2500 万次”。这听起来可能不算太惊人,但这代表了“每周拉取量约为去年同期的 17 倍”。

她形容这条曲线是“非常指数级的”,但也指出,随着他们在考虑该项目的组织中接近饱和,他们已经“有点度过了那个指数级”阶段。Madelyn Olson 表示“许多大型企业正在迁移”,在 Unlocked 会议上,他们听到了来自“Apple 和 Uber 等公司”关于使用 Valkey 的经验,并补充说采用情况“仍然进展顺利”,而且“人们仍然喜欢谈论迁移是多么容易”。

“我们不认为 Redis 会消亡。”

该项目继续将其定位为 Redis 的长期同行,而不仅仅是替代品。“我们不认为 Redis 会消亡,”Madelyn Olson 说,并强调 Redis 拥有“如此深厚的底蕴和名声”,Valkey 社区希望“确保我们能与他们竞争,并帮助鼓励他们开源更多东西”。全 工智能