首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
大数据笔记 | 第四届字节青训营
clare
创建于2022-07-24
订阅专栏
大数据笔记 | 第四届字节青训营
暂无订阅
共10篇文章
创建于2022-07-24
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
从 Kafka 到 Pulsar:数据流演进之路 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第10天 课程内容 01 消息队列的概述 1.1 消息队列的应用场景 MQ消息通道:用在工程开发中,可以理解为一个list或者queue,用于上下游的解耦,
数据湖三剑客:Delta Lake、Hudi 与 Iceberg 详解 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第9天 课程内容 01 发展历史 1.1 Hadoop No schema。不知道数据集的详情 1.2 Hive Hive,在数据湖对数据集中定义,即元数据
深入浅出 HBase 实战 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第8天 课程内容 01 适用场景 1.1 HBase的设计理念 看来Google的三篇论文还是很有指导意义的,一定要抽时间看一下。 1.2 数据模型 结合下
HDFS 高可用和高扩展机制分析 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第7天 01 元数据高可用 1.1 高可用的需求 高可用的形式 \ 1.2 HDFS主备同步实现 日志是全局有序的,目录树和文件信息的更新。块的位置信息不在
HDFS 原理与应用 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第6天 课程内容 01 HDFS基本介绍 1.3 HDFS介绍 1.2 单机文件系统 windows和linux的文件系统 1.3 分布式文件系统 大容量
GitHub协作指南 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第5天 环境 windows系统需要安装git 安装地址:https://git-scm.com/download/win,一路next即可。 检查是否安装
Spark 原理与实践 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第4天 01 Spark介绍 1.1 大数据处理技术栈 1.2 常见大数据处理链路 1.3 常见的大数据处理引擎 1.4 Spark官网介绍 关键特征 多语
Exactly Once 语义在 Flink 中的实现 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第3天 01 数据流和动态表 如何在数据流上执行SQL语句,说明流式处理中的状态的概念 1.1 随处可见的流式数据 1.2 传统SQL和流处理 1.3 数据
流/批/OLAP 一体的 Flink 引擎介绍 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第2天 01 Flink概述 1.1 Flink诞生背景 1.1.1 大数据计算架构发展历史 1.1.2 为什么需要流式计算 对业务的实时性要求比较大 1.
SQL Optimizer 解析 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第1天 课程内容 01 大数据体系 1.1 大数据体系 为什么先介绍SQL? SQL简单,作为大数据框架对外提供统一接口。 One SQL rules bi