开源数据库在这2022年的发展显得异彩纷呈,分析型数据库、图数据库、时序数据库、向量数据库等各细分领域都相继涌现了头部玩家。围绕云原生技术,开源数据库在云化、平台化、一体化、智能化四个方向上全面发展;云数据库在朝着 “Serveless”的方向演进,数据库技术在云资源抽象、封装、归一、统一调度能力上取得了巨大进步。在基础设施全面云化的变革中,开源数据库使得中国基础软件的发展与世界保持同步,甚至起到了部分引领的作用。
我们邀请了多名国内开源数据库领域的专家,为各位开发者解读开源数据库的发展和流行趋势。
以下内容选自《2022中国开源开发者报告:前沿开源技术领域解读》。
2022 年,是开源数据库全面拥抱云原生技术的一年。围绕云原生技术,开源数据库在云化、平台化、一体化、智能化四个方向上全面发展,企业级能力持续增强;同时,由于国际形势风云变化,开源数据库国产化生态迎来了历史性的发展机遇,各类主流开源数据库与国产芯片、操作系统、中间件等全面适配,开源数据库成为了基础软件国产化浪潮中的重要力量。过去一年,开源数据库主要发展如下:
(1)云原生持续做深。以存算分离、资源解藕、资源池化为主要特征的云原生数据库对开源数据库架构的演进产生了深远的影响。计算集群、存储集群、日志集群、管理集群等各个组件独立部署、独立运行、独立缩扩容成为了云原生数据库的标准架构。此外,云原生架构带来的分布式高性能事务处理、大规模分布式并行处理(MPP)、分布式数据一致性协议等关键技术逐步成为了开源数据库的标配。
(2)Serverless 数据库引领趋势。2022 年可以认为是云数据库 Serverless 的元年。在这一年,AWS 首先推出了 Aurora 的 Serverless 形态;阿里云数据库也推出了 RDS MySQL 的 Serverless 形态。云数据库的 Serverless 形态,意味着数据库技术在云资源抽象、封装、归一、统一调度能力上的巨大进步,也离不开高精度弹升技术、智能化技术的发展。
(3)一体化能力改善用户体验。一体化体现在两个方面:一是处理分析一体化,HTAP 是处理分析一体化的典型代表;二是集中分布一体化,其本质上是强调开源数据库对于不同规模的数据量和访问量的适配。
(4)软硬件协同一体化,性能持续优化。目前来看主要有三大发展趋势:一是如何利用云资源解耦的优势,充分发挥云架构下的数据库弹性优势;二是针对云架构下资源互联效率的性能优化;三是针对国产化硬件的性能优化与提升。
(5)企业级能力持续提升。开源数据库开源的不仅仅是内核,开源数据库将越来越关注众多的企业级特性,包括高可用架构、白屏运维、灾备恢复、异地多活、安全可信以及提供各种各样的生态工具,如 DevOps、数据传输、集成开发等。
(6)智能化能力持续增强。主要涉及两个方面:一是数据库内部的智能化(AI4DB),利用数据分析、机器学习、预测预警等智能化技术,实现数据库的自感知、自恢复、自优化与自运维;二是利用数据库的数据与计算融合的能力,对外提供机器学习等智能化能力(DB4AI)。
(7)生态持续融合。数据库逐渐成为一体化的数据平台,集中体现在兼容更多的数据模型及大数据生态。比如,MySQL、PostgreSQL 都通过插件的模式兼容 Redis、Memcached 等内存数据库。
此外,许多开源数据库都将分布式对象存储纳入自己的存储架构中,实现数据冷热分层、数据归档、大数据存储、分析与处理等能力,同时借助各类 connector 和 Catalog,能方便对接大数据相关组件(Hive/Spark/Presto等)。同时,开源数据湖也越来越强调对数据库 CRUD 语义的支持,相信未来大数据数据库一体化、湖仓一体化也将成为发展趋势之一。
想要了解更多前沿开源技术领域解读,请访问《2022中国开源开发者报告》