论国产数据库发展趋势(上)- 以史为鉴,可知兴替

106 阅读8分钟

前言:为什么要讨论这个问题

中国需要做出一个有国际级竞争力的优秀数据库产品

它能够摆脱对外部的依赖,同时又能够带领中国的企业走出国门,在世界的舞台上同台竞争,在打破外部市场的垄断基础上,又能为世界科技的发展做出突出的贡献。

1. 发展趋势的预测 & 根据

原文详见:字节关系型数据库产品线下规划思路 2.1

我在早些年曾对中国数据的发展趋势做出过预判(见上图),从2019年国产数据库的春天开始到现在2024年,去O战略已经发展到了一个相对成熟的阶段。特别是在今年2024 DTCC大会上,华为 GaussDB 已经对外宣称,通过GaussDB + UGO + DRS 组合已经可以实现金融行业可规模化迁移复制能力。

由此可知,国产去O的大门已经开始缓缓关闭了,当前还没有站上舞台的产品已经不再具备分食利益的机会。在未来的1到2年之间,将逐步的将去O这个大型需求场景收拢到国内的几个大型数据库服务提供商手里,所以国产数据库的分水岭要来了

同时这也引出了未来下一阶段的需求:国产数据库跟国际友商同台竞争。 备注:不论是集中式 还是 分布式,目前看起来就是没什么优势。

2. 当前市场上同类产品的不足

从当前国内数据库发展现状来看我们的产品力跟国际巨头相比,面临着极大的不足,这点就不累述了。

除了产品方面的各种差距,我们还存在以下几个问题:

  1. 国内数据库内核开发人员缺失(根据2022年的反馈目前国内数据库内核开发人员4000+)
  2. 国内数据库内核开发人员分配失衡(前10家人员总和超过了2000+,剩下的200多家中,大部分产品实际开发人员不超过5人)
  3. 国内产品自研能力不强(多为MySQL/PG 开源换皮产品)
  4. 国内产品生态建设不完善(生态工具,文档,运维人员 极端缺失)

以上问题每年都在开撕,但是每年也没解决,目前可感知得仅有达梦/OB/GaussDB 在缓慢前行(备:其他厂家我不了解内情)。

但是,以目国产数据库产品的发展状态 & 发展趋势,到2029年依然难以出现一款能够跟国际友商同台竞技,甚至超越友商形态的产品。

3. 如何才能做出符合市场发展规律的跨时代产品

作为一个产品经理,我理解世界上所有的产品都是从客户的实际的需求中逐步产生出来的。

B端可能跟C端不同之处在于,B端不存在假设需求,也不存在创造需求。B端的需求和产品来自于客户真切的痛点和实际的价值。

所以我们应该从客户的实际痛点和诉求出发,才能做出一款客户需要的优秀数据库产品。

1. 一个西瓜吃不出个胖子,脱离市场从内部孵化也是不对的

在这里有两个观点需要说明下。

  1. 当前国产数据库去O是一个极大的内需,这个内需能够支持10年,甚至更多的时间,它的存在确实辅助国产数据库完成从0-1阶段的孵化,对国产数据库的发展有着不可磨灭的极大贡献,但是仅是一个场景,它能够衍生出来的需求非常有限,花费过大的代价去解决它只能够解决眼前的问题,无法解决未来发展问题。关于这个问题在下面第五章节中,结合历史发展我们也可以看出来,它迟早会被淘汰的。

  2. 当前很多国内产品,包括国际友商的产品均有从内部孵化,转ToB的习惯,但是我们可以发现,纵观历史上比较成功的数据库产品,均是以外部广泛的客户为主导,才逐步孵化成功的,不论闭源,还是开源产品均是走的这条路径,而通过内需转ToB的一般没什么发展潜力。

    1.   比如:Azure Cosmos DB,这是一款微软提供的全球化多模数据库产品,也可以说是至今为止最成熟的多模形态数据库产品,但它命运多舛,2008年就在微软内部上线,为微软全球广告业务提供分布式数据集成服务;2014年开始走NoSQL路线;2017年在Azure上作为开放产品提供服务。

    2.   如此来看 Azure Cosmos DB 在技术上无疑是一款引领时代的产品,但是发展到今天,它所取得的商业成功跟它的地位和投入是严重不符的。

    3.   详见:db-engines.com/en/ranking

2. 我们需要什么,为什么需要它

我们需要一个什么样的数据库产品?就像我开头所说的一样,我们需要去深入的了解当前时代背景下,客户的真实诉求,并结合当前时代的发展趋势才能摸索出正确的方向。

在本次DTCC 2024大会上,其他友商阐述的产品和成功案例跟去年并无大多差距,毕竟数据库是一个生命周期很长的产品。但是在会上【邢春晓】同学的发言【先进智能数据库发展趋势,关键技术及产业应用】确实比较完善的阐述了当前时代背景下,中国企业在行业发展上遇到的各种数据库诉求。

我个人认为他的阐述是全面的,方向是正确的,只是这种阐述其实是一种问题的收集,还需要进一步的归纳整理为较为完善的需求,才能作为产品指导方向。

4. 结合过去市场的发展趋势,论新一代数据库的发展阶段

以史为鉴,可知兴替。

在这里我结合数据发展历史,给大家推衍一下未来数据库的发展阶段:

(详见:www.modb.pro/db/225689)

现在大多数同学可见的数据库发展史来源于1960年网状数据库的问世,那网状数据库的问世又是基于什么样的背景下产生的呢?

通过对历史的追溯,我们可以发现当年数据库的产生也有着不可磨灭的时代契机。

历史现在结论
1725 - 1946: 从打孔卡的发明到电子计算机的诞生,这一阶段印证了算力 & 存储的突破式发展,同时通过史料推断,在曼哈顿计划期间,产生了大量的数据管理 & 传输诉求,使得一个新型的数据管理模式的产品需求得以产生。1980 - 2019: 国际数据库产生逐渐进入中国市场,并占领了各行业的核心系统,随着时间的发展,计算 & 存储 & 传播得到进一步的飞跃式发展,特别是公有云的普及,使得数据库服务化更加简单便捷的被使用,新形态数据库产品的需求得以产生计算 & 存储 & 传播 技术的爆发,是新型数据库管理模式得以产生的温床。
1946 - 1963: 在同样级别的阿波罗登月计划的背景下,从理论到实践产生了网状 DBMS2019 - 至今: 随着国产化替代的需求,国产自研新型分布式关系型数据库得以快速发展,以应对当前地缘政治带来的风险,同时也使得国产自研数据库产品得以孵化成功大型长周期需求,是数据库产品得以孵化的契机
1963 - 1970: 虽然网状数据库被大规模应用于大型机,但是随着电脑的小型化发展,大规模的市场化带来的诉求和痛点,最终产生了 《大型共享数据库数据的关系模型》未来: 但是国产化替代,并不能满足市场上针对当前数据库产品越来越多的痛点问题进行解决那未来我们需要的真正跨时代产品是什么?

5. 结论

讲到这,我想大家、心中都有自己的答案,不妨说出来大家研究研究。