首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
纯纯子
掘友等级
获得徽章 1
动态
文章
专栏
沸点
收藏集
关注
作品
赞
17
文章 10
沸点 7
赞
17
返回
|
搜索文章
最新
热门
走进 Yarn 资源管理和调度 | 青训营笔记
这是我参与 「第四届青训营 」 笔记创作活动的第15天 初识调度系统 yarn 简述 Hadoop 的两个重要组件分别是 HDFS 和 MapReduce,其中 HDFS 负责存储,MapReduce
浅谈分布式一致性协议 | 青训营笔记
这是我参与 「第四届青训营 」 笔记创作活动的第14天 远程过程调用(RPC) 分布式系统中通常将不同组件,或者不同节点的交互使用 RPC 的方式进行封装,在调用方的视角一次远程过程调用不需要关心如何
LSMT 存储引擎浅析 | 青训营笔记
这是我参与 「第四届青训营 」 笔记创作活动的第13天 最早提出 LOG-STRUCTURED MERGE-TREE(LSMT) 的论文 www.cs.umb.edu/~poneil/lsm… in
Parquet与 ORC :高性能列式存储 | 青训营笔记
这是我参与 「第四届青训营 」 笔记创作活动的第12天 典型的大数据系统可以简单的概括为由业务层、计算层和存储层三层结构组成 在计算层,有各种计算引擎解决不同场景的问题,例如 Spark 主要适用于批
从 kafka 到 Pulsar :数据流演进之路 | 青训营笔记
这是我参与 「第四届青训营 」 笔记创作活动的第11天 消息队列概述 消息队列应用场景 MQ 消息通道 - EventBridge 事件总线 - Data Platform 数据流平台 主流消息队列介
Delta Lake、Hudi与Iceberg详解 | 青训营笔记
这是我参与 「第四届青训营 」 笔记创作活动的第10天 1. 发展历史 HDFS:难管理 数据湖最开始的概念——分布式存储HDFS 使用目录来区分不同的数据集 好处: 同一公司/组织可以使用共享存储
深入浅出 HBase 实战 | 青训营笔记
这是我参与 「第四届青训营 」 笔记创作活动的第9天 什么是HBase HBase是一个开源的 NoSQL 分布式数据库,是Apache 软件基金会顶级项目之一。 参考 Google Bigtable
HDFS 高可用与高扩展机制分析 | 青训营笔记
这是我参与 「第四届青训营 」 笔记创作活动的第8天 元数据高可用 高可用的需求 故障类型:硬件故障、软件故障、人为故障 灾难:数据中心级别不可用 机房断电 机房空调停机 机房间网络故障、拥塞 高可用
HDFS 原理与应用 | 青训营笔记
这是我参与 「第四届青训营 」 笔记创作活动的第7天 笔记 认识Hadoop技术体系,理解“计算+存储”的程序应用逻辑 存储层:HDFS 调度层:YARN 计算框架:MapReduce。值得注意的是另
Presto 架构原理与优化介绍 | 青训营笔记
这是我参与 「第四届青训营 」 笔记创作活动的第6天 概述 什么是大数据 在信息化时代背景下,由于信息交互,信息存储,信息处理能力大幅增加而产生的数据 大数据与OLAP的演进: Hadoop:基于廉价
下一页
个人成就
文章被点赞
1
文章被阅读
11,386
掘力值
376
关注了
5
关注者
8
收藏集
0
关注标签
14
加入于
2022-07-11