用户3398530186343

赞

1

|

搜索文章

HDFS 高可用和高扩展机制分析｜青训营笔记

这是我参与「第四届青训营」笔记创作活动的第9天元数据服务高可用需求故障类型：硬件/软件/人为灾难：数据中心级别不可用，比如机房断电，机房空调停机，机房间网络故障或者拥塞服务可用性的衡量指标 M

3年前
152
点赞
评论

HDFS 原理与应用 | 青训营笔记

这是我参与「第四届青训营」笔记创作活动的的第8天 HDFS原理与应用 HDFS原理 HDFS（Hadoop Distributed File System）是一个分布式文件系统，是谷歌的GFS山寨版本

3年前
67
点赞
评论

Presto 架构原理与优化简介｜青训营笔记

这是我参与「第四届青训营」笔记创作活动的的第7天。大数据与OLAP的演变信息交换：通信和网络宽带的大幅增长信息存储：计算机存储量的大幅增长信息处理：整理、转换、分析数据的能力大幅增长 Hado

3年前
89
点赞
评论

大数据 Shuffle 原理与实践｜青训营笔记

这是我参与「第四届青训营」笔记创作活动的的第6天。 Shuffle概述 shuffle的作用就是把map阶段和reduce阶段连接起来，充当一个桥梁的作用。 shuffle只能产生[k,v]类型的Pa

3年前
171
点赞
评论

Spark 原理与实践 | 青训营笔记

这是我参与「第四届青训营」笔记创作活动的第5天。大数据处理引擎Spark介绍 Spark生态和特点统一引擎，支持多种分布式场景多语言支持可读写丰富数据源丰富灵活的API算子 SparkCor

3年前
143
点赞
评论

流计算中的Window计算 | 青训营笔记

这是我参与「第四届青训营」笔记创作活动的第4天一、概述 1. 流式计算vs批式计算特性批式计算流式计算数据存储 HDFS、Hive Kafka、Pulsar 数据时效性天级别分钟级别准

3年前
124
点赞
评论

Exactly Once 语义在 Flink 中的实现｜青训营笔记

这是我参与「第四届青训营」笔记创作活动的第3天大数据定义大数据的定义：高速 (Velocity) 涌现的大量 (Volume) 的多样化 (Variety) 数据。这一定义还表明大数据具有 3V

3年前
99
点赞
评论

流/批/OLAP 一体的 Flink 引擎介绍 | 青训营笔记

流/批/OLAP 一体的 Flink 引擎介绍 | 青训营笔记这是我参与「第四届青训营」笔记创作活动的第2天大数据大数据(Big Data):指无法在一定时间内用常规软件工具对其进行获取、存储

3年前
130
点赞
评论

SQL Optimizer 解析｜青训营笔记

SQL Optimizer 解析｜青训营笔记这是我参与「第四届青训营」笔记创作活动的的第1天。 SQL Optimizer是什么 SQL Optimizer是SQL查询优化器 SQL 查询优化的目的

3年前
229
点赞
评论

个人成就

文章被阅读 2,599

加入于

2022-06-29