数据湖三剑客：Delta Lake、Hudi 与 Iceberg 详解 | 青训营笔记这是我参与「第四届青训营」笔记创

这是我参与「第四届青训营」笔记创作活动的的第8天

数据湖

数据仓库的主流定义是位于多个数据库上的大容量存储库，它的作用在于存储大量的结构化数据，为管理分析和业务决策提供统一的数据支持，存取过程相对比较繁琐，对于数据类型有一定限制，
数据仓库的主流定义是位于多个数据库上的大容量存储库，它的作用在于存储大量的结构化数据，为管理分析和业务决策提供统一的数据支持，虽然存取过程相对比较繁琐，对于数据类型有一定限制。
湖仓一体是一种结合了数据湖和数据仓库优势的新范式，在用于数据湖的低成本存储上，实现与数据仓库中类似的数据结构和数据管理功能。湖仓一体是一种更开放的新型架构，有人把它做了一个比喻，就类似于在湖边搭建了很多小房子，有的负责数据分析，有的运转机器学习，有的来检索音视频等，至于那些数据源流，都可以从数据湖里轻松获取。
这里需要注意的是，“湖仓一体”并不等同于“数据湖”+“数据仓”