首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
冬天真的冷
掘友等级
获得徽章 1
动态
文章
专栏
沸点
收藏集
关注
作品
赞
1
文章 1
沸点 0
赞
1
返回
|
搜索文章
最新
热门
数据湖三剑客:Delta Lake、Hudi 与 Iceberg 详解 | 青训营笔记
这是我参与「第四届青训营」笔记创作活动的的第10天 一、发展历史 数据湖三阶段:Hadoop、Hive、湖仓一体 Hadoop HDFS-分布式存储系统: HDFS通过将文件分块来存储大文件,HDFS
深入浅出HBase实战 | 青训营笔记
这是我参与「第四届青训营」笔记创作活动的的第10天 一、适用场景 1.1 什么是HBase ? HBase基于HDFS实现存储计算分离架构的分布式表格存储服务。 HBase是一个开源的NoSQL分布式
HDFS高可用与高扩展性机制分析 | 青训营笔记
这是我参与「第四届青训营」笔记创作活动的的第9天 一、元数据高可用 (主备系统:基于日志、自动切换、实时热备) 1.1服务高可用的需求 故障类型: 1)硬件故障 2)软件故障 3)人为故障 灾难:数据
HDFS原理与应用 | 青训营笔记
这是我参与「第四届青训营」笔记创作活动的的第8天 一.HDFS基本介绍 0.1 HDFS: Hadoop Distributed File System 1.1 Windows单机文件系统 1.2 L
Presto 架构原理与优化介绍 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第七天 1.概述 大数据与OALP系统的演进 什么是大数据 关于大数据我们参考马丁·希尔伯特的总结:大数据其实是在2000年后,因为信息化的快速发展、信息交
Spark原理与实践 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第6天 一、大数据处理引擎Spark介绍 1.大数据处理技术栈 2.常见大数据处理链路 3.开源大数据处理引擎 Batch:Hadoop、Hive、Spar
大数据 Shuffle 原理与实践 | 青训营笔记
这是我参与「第四届青训营」笔记创作活动的第5天 1.Shuffle概述 MapReduce概述 2004年,谷歌发布了《MapReduce:Simplified Data Processing on
流计算中的window计算 | 青训营笔记
这是我参与「第四届青训营」笔记创作活动的第4天 一、概述 1.流式计算vs批式计算 数据价值:实时性越高、数据价值越高 2.批处理 批处理模型典型的数仓为T+1架构,即数据计算是天级别的,当天只能看到
Exactly Once 语义在 Flink 中的实现 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第3天! Exactly Once 语义 1.数据流和动态表 1.1 随处可见的流式数据 1.2 传统SQL和流处理 1.3 数据流和动态表转换 Strea
流/批/OLAP 一体的Flink引擎 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第2天 Flink 一、Apache Flink 的诞生背景 1、 什么是大数据 大数据(Big Data) :指无法在一定时间内用常规软件工具对其进行获取
下一页
个人成就
文章被点赞
1
文章被阅读
1,220
掘力值
97
关注了
0
关注者
0
收藏集
0
关注标签
0
加入于
2022-06-28