首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
为了工作拼命学习的大数据小白
掘友等级
获得徽章 1
动态
文章
专栏
沸点
收藏集
关注
作品
赞
4
文章 4
沸点 0
赞
4
返回
|
搜索文章
最新
热门
走进 Yarn 资源管理和调度| 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第1天 一、Yarn概述 调度系统演进-调度系统发展的背景 IT 到DT时代的变革,注重数据价值; 数据计算方式的变革,注重计算效率; 企业对外服务需数以万
浅谈分布式一致性协议| 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第14天 一、分布式系统 分布式系统面临的挑战 数据规模越来越大 服务的可用性要求越来越高 快速迭代的业务 要求系统足够易用 理想中的分布式系统 高性能:可
Parquet与ORC:高性能列式存储| 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第13天 一、列存vs行存 数据格式层概述 计算层:各种计算引擎 存储层:承载数据的持久化存储 数据格式层:定义了存储层文件内部的组织格式,计算引擎通过格式
从 Kafka 到 Pulsar:数据流演进之路| 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第12天 一、消息队列概述 消息队列的应用场景 MQ消息通道 EventBridge事件总线 Data Platform流数据平台 MQ消息通道 异步解耦
数据湖三剑客:Delta Lake、Hudi 与 Iceberg 详解| 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第11天 一、发展历史 什么是数据仓库? 数据仓库将数据从数据源提取和转换,加载到目的地 数据仓库存储+计算不分离 数据仓库严格控制写入数据的schema
深入浅出 HBase 实战| 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第10天 Hbase适用场景 什么是HBase ? HBase是一个开源的NoSQL分布式数据库,是Apache软件基金会顶级项目之一。 参考Google
HDFS 高可用和高扩展机制分析| 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第9天 元数据服务高可用 1.1高可用的需求 故障类型: 硬件故障 软件故障 人为故障 故障不可避免,灾难时有发生。 而如果HDFS系统不可用。 无法核算广
HDFS 原理与应用| 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第8天 一、HDFS基本介绍 分布式文件系统 大容量 更多的机器,更多的存储介质 高可靠 多个副本提高容错能力 低成本 不需要高端硬件来扩容 HDFS功能特
Presto 架构原理与优化介绍| 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第7天 一、概述 大数据与OLAP的演进 OLAP(OnLine Analytical Processing对业务数据执行多维分析,并提供复杂计算,趋势分析
大数据 Shuffle 原理与实践| 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第6天 一、Shuffle概述 Map阶段 Map阶段,是在单机上进行的针对一小块数据的计算过程\ Shuffle阶段 Shuffle阶段,在map阶段的基
下一页
个人成就
文章被点赞
2
文章被阅读
1,167
掘力值
160
关注了
0
关注者
1
收藏集
0
关注标签
0
加入于
2022-07-03