首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
菜鸟a小李
掘友等级
获得徽章 2
动态
文章
专栏
沸点
收藏集
关注
作品
赞
16
文章 16
沸点 0
赞
16
返回
|
搜索文章
最新
热门
深入理解 K8S 资源管理和调度|青训营笔记
这是我参与「第四届青训营」笔记创作活动的第 16天 1. kubernetes调度过程 假如要创建一个pod(对应Pod1的定义yaml),对应的调度过程是? ApiServer 会先把这个待创建的请
走进 Yarn 资源管理和调度|青训营笔记
这是我参与「第四届青训营」笔记创作活动的第 15 天 YARN架构 1 RM(ResourceManager) + N NM(NodeManager) ResourceManager的职责 一个集群a
浅谈分布式一致性协议|青训营笔记
这是我参与「第四届青训营」笔记创作活动的第 14 天 先谈分布式 设计一个分布式系统必定会遇到一个问题—— 因为分区容忍性(partition tolerance)的存在,就必定要求我们需要在系统可用
Parquet 与 ORC:高性能列式存储|青训营笔记
这是我参与「第四届青训营」笔记创作活动的第 13 天 什么是列式存储 传统的数据编码方式是以行为单位进行,列式存储则是将数据划分成数据块,每个数据块内部按列的方式进行编码存储,通过使用列式存储会有以下
从 Kafka 到 Pulsar:数据流演进之路|青训营笔记
这是我参与「第四届青训营」笔记创作活动的第12天 历史背景 Pulsar源自Yahoo,于2016年开源并捐献给Apache基金会,并在2018年9月升级成为Apache顶级项目。 Kafka最初由L
数据湖三剑客:Delta Lake、Hudi 与 Iceberg 详解|青训营笔记
这是我参与「第四届青训营」笔记创作活动的第11天 共同点 定性上讲,三者均为 Data Lake 的数据存储中间层,其数据管理的功能均是基于一系列的 meta 文件。meta 文件的角色类似于数据库的
深入浅出 HBase 实战|青训营笔记
这是我参与「第四届青训营」笔记创作活动的第10天 1.1 什么是HBase ? HBase是一个开源的NoSQL分布式数据库,是Apache软件基金会顶级项目之一。 参考Google BigTable
HDFS 高可用和高扩展机制分析|青训营笔记
这是我参与「第四届青训营」笔记创作活动的第9天 一、HDFS的高可用(HA) 下面我们首先来看一下HDFS的高可用,也可以称之为HA(High Available) HDFS的HA,指的是在一个集群中
HDFS原理与应用|青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第8天 HDFS原理与应用 1、HDFS原理 HDFS(Hadoop Distributed File System)是一个分布式文件系统,是谷歌的GFS山
大数据 Shuffle 原理与实践|青训营笔记
这是我参与「第四届青训营」笔记创作活动的的第7天 1.Shuffle 过程 map 阶段处理的数据如何传递给 reduce 阶段,是 MapReduce 框架中最关键的一个流 程,这个流程就叫 shu
下一页
个人成就
文章被点赞
15
文章被阅读
1,885
掘力值
195
关注了
1
关注者
0
收藏集
0
关注标签
39
加入于
2022-06-28