获得徽章 0
8月10日打卡,今日学习《深度解析 Raft 分布式一致性协议》:本文用Raft 论文来讲解了 Raft 算法思路,并对难理解及容易误解的内容进行详细解答。通过这篇文章我深入理解了 Raft 算法,不易理解或容易误解的关键点也有了理解。可以读完后用在实践中,检验一下自己所学到的知识。
评论
点赞
7月30日打卡,今日学习《SparkSQL 在企业级数仓建设的优势》:文章介绍了企业级数仓构建需求、企业级数仓技术选择、SparkSQL 如何支撑企业级数仓,最后讲述了字节跳动 EMR 产品在 Spark SQL 的优化实践的一些基本要点。可以先学习理论,再结合字节跳动优化实践来整体看文章,有利于理解Spark SQL 灵活构建数仓的知识。
评论
点赞
8月6日打卡,今日学习《字节跳动10万节点HDFS集群多机房架构演进之路》:本文通过对HDFS现状、动机的分析,详细展开了社区版架构和字节版架构。最后讲解了HDFS的演进。让我收获到HDFS 的多机房架构依然在持续迭代,后面也会有更多机房出现。
评论
点赞
8月9日打卡,今日学习《入门Hbase,看这一篇就够了》:系统化的整理了Hbase。包括Hbase特性,Hbase的架构、HFile的详细讲解。有Hbase单机模式安装和使用,包括环境和安装单机的具体步骤,非常详细,对新手有很大帮助。还有Hbase设计时要考虑的因素、Java API操作、操作优化、Scan的重要参数等详细知识。看完以后收获非常大。
评论
点赞
8月6日打卡,今日学习《字节跳动10万节点HDFS集群多机房架构演进之路》:本文通过对HDFS现状、动机的分析,详细展开了社区版架构和字节版架构。最后讲解了HDFS的演进。让我收获到HDFS 的多机房架构依然在持续迭代,后面也会有更多机房出现。
评论
点赞
8月5日打卡,今日学习《带你入坑大数据(一) --- HDFS基础概念篇》:这篇文章介绍了HDFS的概念、HDFS的三大组件、HDFS机制:心跳机制负载均衡三大部分。都是基础的概念,而且用清晰明了的语言来描述知识点,有利于新手学习。
评论
点赞
8月2日打卡,今日学习《5小时推开Spark的大门——02.搭建开发环境》:这篇文章介绍了Spark的安装和Scala环境的搭建。其中包括环境变量的配置,IDEA下载插件等详细步骤,刚入手大数据的时候可以根据这个文章来搭建开发环境,开始实践。
评论
1
7月31日打卡,今日学习《Spark的Shuffle总结分析》:本文总结了shuffle原理分析、HashShuffle机制、HashShuffle机制、使用到的参数,四个大的部分,内容详细有重点,在最后一部分对参数的影响的介绍,可以让我们快速理解Spark的Shuffle各个参数的作用。是一篇不错的文章。
1
1