首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
二粒砂
掘友等级
首席摸鱼官
获得徽章 11
动态
文章
专栏
沸点
收藏集
关注
作品
赞
71
文章 44
沸点 27
赞
71
返回
|
搜索文章
赞
文章( 44 )
沸点( 27 )
Parquet与ORC:高性能列式存储 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第13天 所有大数据作业简单来说都可以简化为 从存储服务读取数据 计算引擎解析和计算数据 结果呈现 “如何高效从存储读取所需的数据”是决定大数据计算作业性能的
从Kafka到Pulsar:数据流演进之路 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第12天 1.消息队列概述 消息队列在各个领域扮演的角色 ①消息队列的应用场景 MQ消息通道 异步解耦 削峰填谷 发布订阅 高可用 EventBridge数据
数据湖三剑客:Delta Lake、Hudi与Iceberg详解 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第11天 1.发展历史 数据湖三阶段:Hadoop、Hive、湖仓一体 ①数据湖发展阶段1-Hadooop 数据湖最开始的概念——分布式存储HDFS 使用目录
深入浅出HBase实战 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第10天 1.适用场景 介绍HBase的设计理念、数据模型、适用场景、业界典型用例 ①什么是HBase HBase是一个开源的NoSQL分布式数据库,是Apa
HDFS高可用和高扩展机制分析 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第9天 一个“可以用”的系统和“好用”的系统,差距就是“高可用”和“高可扩展性” 1.元数据高可用 主备系统:基于日志、自动切换、实时热备 ①高可用的需求 服
HDFS原理与应用 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第8天 1.HDFS基本介绍 HDFS:Hadoop Distributed File System spark不是Hadoop的子项目,但是其很多功能的实现
Presto架构原理与优化介绍 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第7天 1.概述 ①大数据与OLAP系统的演进 大数据其实是在2000年后,因为信息化的快速发展,信息交换、信息存储、信息处理三个方面能力的大幅增长而产生的数
一文讲清HBase存储结构
Hbase 是一个分布式的、多版本、面向列的开源 KV 数据库。运行在 HDFS 的基础上,支持 PB 级别、百万列的数据存储。作为性能如此强大的KV数据库,HBase的存储结构究竟是怎样的呢?面向列的存储结构究竟有什么样的不同之处呢?接下来会详细讲解这部分。 为了清晰地表述这…
大数据Shuffle原理与实践 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第6天 1.Shuffle概述 Shuffle是什么,为什么需要Shuffle,Shuffle的基本过程是怎么样的 ①MapReduce概述 在开源实现的Ma
Spark原理与实践 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第5天 1.大数据处理引擎Spark介绍 Spark:用于大规模数据处理的统一的引擎,可用于单机节点或者集群上进行数据工程、数据科学和机器学习 ①Spark生
下一页
个人成就
文章被点赞
30
文章被阅读
3,504
掘力值
323
关注了
0
关注者
2
收藏集
2
关注标签
24
加入于
2021-12-28