首页
沸点
课程
AI Coding
数据标注
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
用户7317638027324
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
YARN 资源管理和调度 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第十六天 yarn yarn是hadoop集群当中的资源管理系统模块,从hadoop2.0开始引入yarn模块,yarn可为各类计算框架提供资源的管理和调度,
分布式一致性协议 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第十五天 CAP CAP是指在一个分布式系统中,一致性(Consistency)、可用性(Availability)、分区容错性(Partition tole
LSMT 存储引擎 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第十四天 LSMT,即Log-Structured Merge-Tree,这是一个经典的数据结构,在大数据系统中有着非常广泛的应用。很多耳熟能详的经典系统,底
Parquet 和 ORC:高性能列式存储 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第十三天 Parquet概述 Apache Parquet是面向分析型业务的列式存储格式,由Twitter和Cloudera合作开发,Parquet是一种与语
为何需要 Pulsar | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第十二天 Kafka 不足 Kafka 没有租户概念,需要手动维护多个集群,不方便运维。 Kafka 集群扩容后需要做 Reassign Partitions
数据湖三剑客:Delta Lake、Hudi 与 Iceberg 分析 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第十一天 数据湖的优点 数据湖相比传统数仓而言,最明显的便是优秀的T+0能力,这个解决了Hadoop时代数据分析的顽疾。传统的数据处理流程从数据入库到数据处理
深入浅出 HBase 实战 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第十天 HBase 是一种类似于数据库的存储层,也就是说 HBase 适用于结构化的存储。并且 HBase 是一种列式的分布式数据库。HBase 底层依旧依赖
HDFS 高可用与高扩展性机制分析 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第九天 HDFS的高可用(HA) 首先来看一下HDFS的高可用,也可以称之为HA(High Available) HDFS的HA,指的是在一个集群中存在多个N
HDFS原理与应用 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第八天 HDFS特性 高性能 容错 相对简单的中心化管理 主/从架构(M/S) 安全 2种级别的安全可供选择 优化的分布式处理 数据本地性 可扩展性 HDFS
Presto 架构原理与优化介绍 | 青训营笔记
Presto 是 Facebook 推出的一个基于Java开发的大数据分布式 SQL 查询引擎,可对从数 G 到数 P 的大数据进行交互式的查询,查询的速度达到商业数据仓库的级别。
下一页
个人成就
文章被阅读
2,017
掘力值
171
关注了
0
关注者
0
收藏集
0
关注标签
12
加入于
2022-07-02