首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
shiyue
掘友等级
获得徽章 1
动态
文章
专栏
沸点
收藏集
关注
作品
赞
40
文章 20
沸点 20
赞
40
返回
|
搜索文章
赞
文章( 20 )
沸点( 20 )
【大数据专场 学习资料七】第四届字节跳动青训营
第四届字节跳动青训营讲师非常用心给大家整理了课前、中、后的学习内容,同学们自我评估,选择性查漏补缺,便于大家更好的跟上讲师们的节奏,祝大家学习愉快,多多提问交流~
Yarn 资源管理和调度|青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第22天 青训营已经接近尾声了,项目也要开始开展了,后面可能会更一些项目方面的文章,好了废话少说,继续更文 yarn是什么 ,yarn是Hadoop 2.0
分布式一致性协议|青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第21天 什么是分布式一致性 在分布式系统中,为了消除单点提高系统可用性,通常会使用副本来进行容错,但这会带来另一个问题,即如何保证多个副本之间的一致性?
LSMT 存储引擎|青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第20天 LSMT是什么 LSMT,即Log-Structured Merge-Tree,这是一个经典的数据结构,在大数据系统中有着非常广泛的应用。
Parquet 和 ORC的高性能列式存储|青训营笔记
这是我参与「第四届青训营 」列式存储笔记创作活动的第18天 今天带来的是列式存储 行存 vs 列存 数据格式层 数据格式层:定义了存储层文件内部的组织格式,计算引擎通过格式层的支持来读写文件
从 Kafka 到 Pulsar|青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第17天 继续更文 主流消息队列 Kafka 详解 Kafka的特性 高吞吐量、低延迟:kafka每秒可以处理几十万条消息,它的延迟最低只有几毫秒 可扩展性
数据湖三剑客:Delta Lake、Hudi 与 Iceberg|青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第15天 发展历史 数据湖发展阶段-Hadoop 数据湖最开始的概念——分布式存储HDFS使用目录来区分不同的数据集。 好处:同─公司/组织可以使用共享存储心
HBase|青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第14天 今天带来的是HBase... 特性 Hbase是一种NoSQL数据库,这意味着它不像传统的RDBMS数据库那样支持SQL作为查询语言。Hbase是一
HDFS 的元数据高可用|青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第13天 今天带来的是HDFS的高可用性。 高可用 复制状态机 Replicated State Machine 操作日志 Op Log / Edit Log
HDFS 原理|青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第12天 今天带来的是HDFS原理,HDFS概述 HDFS集群分为两大角色:NameNode、DataNode (Secondary Namenode)
下一页
个人成就
文章被点赞
16
文章被阅读
2,239
掘力值
191
关注了
1
关注者
1
收藏集
0
关注标签
3
加入于
2022-07-07