首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
数据湖
订阅
Goolv
更多收藏集
微信扫码分享
微信
新浪微博
QQ
8篇文章 · 0订阅
从数据仓库到数据湖(上):数据湖导论
什么是数据湖? 起源 数据湖的概念最早由Pentaho的创始人兼CTO詹姆斯·迪克森(James Dixon)于2010年10月在纽约Hadoop World大会上提出。
Flink + Iceberg 全场景实时数仓的建设实践
摘要:Apache Flink 是目前大数据领域非常流行的流批统一的计算引擎,数据湖是顺应云时代发展潮流的新型技术架构,以 Iceberg、Hudi、Delta 为代表的解决方案应运而生,Iceberg 目前支持 Flink 通过 DataStream API /Table A…
流批一体在京东的探索与实践
本文整理自京东高级技术专家韩飞在 Flink Forward Asia 2021 流批一体专场的演讲。
从数据仓库到数据湖(下):热门的数据湖开源框架
在上一篇从数据仓库到数据湖(上):数据湖导论文章中,我们简单讲述了数据湖的起源、使用原因及其本质。本篇文章将着重介绍市面上热门的数据湖开源框架,并分享笔者对当前数据湖技术的理解和看
Magnus: 哔哩哔哩Iceberg智能数据管理和优化
B站湖仓一体平台数据规模约60PB,主要服务于BI报表、指标服务、A/B Test、人群圈选、日志等场景,日查询量超过400万,查询P99响应时间约为3s。
数据湖三剑客:Delta Lake、Hudi与Iceberg详解|青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第4天 这节课的重点内容包括四部分:发展历史、核心技术、各有所长、总结场景。
数据湖三剑客:Delta Lake、Hudi 与 Iceberg 详解 | 青训营笔记
今天的学习内容是数据湖三剑客:Delta Lake、Hudi 与 Iceberg ,数据湖三阶段:Hadoop、Hive、湖仓一体,还有三大数据湖的工作重点、核心技术等内容。
云数仓 ByteHouse 的湖仓一体设计与实践
本次交流将聚焦 ByteHouse 湖仓一体主题,介绍当代分析平台的挑战与 ByteHouse 一体化理念