首页
沸点
课程
AI Coding
数据标注
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
madidea
掘友等级
获得徽章 3
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
madidea
3年前
举报
还没收到抽奖礼物
反馈 & 建议
分享
2
点赞
madidea
3年前
关注
深入理解 K8S 资源管理和调度 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第16天 Kubernetes简介 为什么需要 ? 容器相比于传统的虚拟化技术,更轻量,更敏捷,更易于管理,运维成本更低; 如果容...
0
评论
分享
madidea
3年前
关注
走进YARN资源管理与调度 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第15天 Yarn概述 调度系统解决的问题 用有限资源解决有限资源无法满足的需求时就需要调度; 调度系统主要解决资源请求和可用资源...
0
评论
分享
madidea
3年前
关注
浅谈分布式一致性协议 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第14天 分布式系统 分布式系统面临的挑战 数据规模越来越大 服务的可用性要求越来越高 快速迭代的业务要求系统足够易用 远程过程调...
0
评论
分享
madidea
3年前
关注
LSMT 存储引擎浅析 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第13天 LSMT历史&是什么 Log-Structured Merge-Tree的缩写,由Patrick O ‘Neil etc...
0
评论
分享
madidea
3年前
关注
Parquet与ORC:高性能列式存储 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第12天 列式存储和行式存储 数据格式层概述 计算层:各种计算引擎 存储层:承载数据持久化存储 数据格式层:定义了存储层内部的组织...
0
评论
分享
madidea
3年前
关注
从 Kafka 到 Pulsar:数据流演进之路 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第11天 架构 Kafka Kafka架构由broker和zookeeper组成: Pulsar Pulsar的架构如下: 不同:...
0
评论
分享
madidea
3年前
关注
数据湖三剑客:Delta Lake、Hudi 与 Iceberg | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第10天 发展历史 Hadoop 数据湖最开始的概念——分布式存储HDFS使用目录来区分不同的数据集。 好处: 同一公司/组织可以...
0
评论
分享
madidea
3年前
关注
深入浅出HBase实战 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第9天 一、HBase适用场景 HBase概述 HBase是一个开源的NoSQL 分布式数据库,是Apache软件基金会顶级项目之...
0
评论
分享
madidea
3年前
关注
HDFS 高可用和高扩展机制分析 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第8天 元数据高可用 高可用:系统在困境(adversity,比如硬件故障、软件故障、人为错误)中仍可正常工作(正确完成功能,并能...
0
评论
分享
madidea
3年前
关注
HDFS 原理与应用 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第7天 分布式文件系统典型代表HDFS 在Hadoop中,HDFS是存储层,YARN是调度层,MapReduce是应用层 HDFS...
0
评论
分享
madidea
3年前
关注
Presto 架构原理与优化介绍 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第6天 概述 大数据与OLAP系统的演进 信息交换:通信和网络宽带的大幅增长 信息存储:计算机存储量的大幅增长 信息处理:整理、转...
0
评论
分享
madidea
3年前
关注
大数据 Shuffle 原理与实践 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第5天 Shuffle概述 什么是shuffle? 在最初的大数据计算工具MR任务中的map与reduce间需要进行Shuffle...
0
评论
分享
madidea
3年前
关注
Spark 原理与实践 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第4天 大数据处理链路 数据源 -> 采集 -> 存储 -> 处理 -> 分析 -> 应用 Spark Spark 是一种与 Ha...
0
评论
分享
madidea
3年前
关注
流计算中的 Window 计算 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第3天 流式计算 实时计算的处理时间窗口:数据实时流动实时计算,窗口结束就提交数据。 处理时间:数据在流式计算系统中真正处理时所在...
0
评论
分享
madidea
3年前
关注
流/批/OLAP 一体的 Flink 引擎介绍 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第2天 Flink 计算架构发展历史:史前阶段~2006 (单机,传统数仓) →\rightarrow→ Hadoop (分布式,...
0
评论
分享
madidea
3年前
关注
SQL Optimizer 解析 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第1天 一、 大数据体系和SQL SQL的处理流程 Parser String -> AST (Abstruct Syntax T...
0
评论
分享
madidea
3年前
关注
搜索引擎项目总结 | 青训营笔记
这是我参与「第三届青训营 -后端场」笔记创作活动的的第8篇笔记 二、项目介绍 我们小组本次青训营选题为搜索引擎项目, 详情可戳搜索引擎项目Github,构建了一个具备基础功...
0
评论
分享
madidea
3年前
关注
将我的服务开放给用户 | 青训营笔记
这是我参与「第三届青训营 -后端场」笔记创作活动的的第7篇笔记 企业接入升级打怪之路 域名系统 host管理 example公司 主机表 Host->ip 映射 使用域名系...
0
评论
分享
下一页
个人成就
文章被阅读
2,911
掘力值
258
关注了
0
关注者
0
收藏集
0
关注标签
0
加入于
2021-12-16