KaiwuDB王小虎:数字能源产业升温,多模数据库或将流行

123 阅读3分钟

开源数据库在这2022年的发展显得异彩纷呈,分析型数据库、图数据库、时序数据库、向量数据库等各细分领域都相继涌现了头部玩家。围绕云原生技术,开源数据库在云化、平台化、一体化、智能化四个方向上全面发展;云数据库在朝着 “Serveless”的方向演进,数据库技术在云资源抽象、封装、归一、统一调度能力上取得了巨大进步。在基础设施全面云化的变革中,开源数据库使得中国基础软件的发展与世界保持同步,甚至起到了部分引领的作用。

我们邀请了多名国内开源 数据库领域的专家,为各位开发者解读开源数据库的发展和流行趋势。

以下内容选自《2022中国开源开发者报告:前沿开源技术领域解读》

image.png

近年来,随着“碳达峰、碳中和”的目标逐步深化,能源行业的转型已进入了一个全新的阶段。据估计,2025 年,能源 IT 行业规模 1152 亿,全球能源数字化市场规模 640 亿。随着新能源在发电、用电、传输各环节的系统不确定性显著增加以及能源转型趋势从传统的集中式走向分布式,需要智能传感物联网、人工智能、云计算、大数据等各种信息技术数字化赋能能源物联网,以数据和算法为核心生产要素,全方位实现能源产业从实物资产向数字资产的转化。

在这其中,数据与算法能够很好地为数字赋能,包括:以传感器技术和嵌入式技术为代表的物联网技术,以机器人、语音识别、图像识别为代表的人工智能技术,以分布式处理、云原生、高可用,同时处理 OLTP 和 OLAP 为特点的分布式数据库技术,以大量、高速、多样、低价值密度、真实性为特征的大数据技术等。

目前,数字能源场景下传统的数据库面临着各种挑战,例如:水平扩展能力不足,数据量增加,只能依靠硬件 scale up;技术架构陈旧、复杂,导致性能、可用性、可靠性不佳;运维成本高昂,数据分析能力偏弱,缺乏对当前流行的各种大数据分析接口的支持,缺乏流计算能力,云端部署支持不足,更无法支持 PaaS 等。

因此,针对能源产业的现状,未来的数据库需要具备以下特性,才能满足日益增长和不断变化的市场和需求:

  1. 海量时序数据高吞吐率写入,支持每秒百万级别的单/多指标写入,可增加随时间变化而产生的数据集;

  2. 批量高速复杂查询;

  3. 统一运管低成本运维:容器部署升级简易快速; 支持在线并发压缩; 支持查看时间序列、标签、指标的定义;

  4. 认证加密保障数据安全:为不同用户配置不同权限,对接入数据库用户进行身份认证;

  5. 压缩数据直接加载:数据压缩无需解压缩,降本增效;

  6. 支持集群部署:集群适用于大数据分析和边缘计算应用程序的高性能平台;

  7. 类 SQL 查询:支持 SQL 语法、类 SQL 语法、 SQL 写入、多开发语言、多协议兼容。

如果未来可以搭建一套多模数据库,统一提供时序、HTAP、消息等各种能力,可能会是解决现实问题的一个有效的选择。


想要了解更多前沿开源技术领域解读,请访问《2022中国开源开发者报告》