内容大纲(暂定)
- 大数据与软硬件
- MapReduce 与 Hadoop
- Hadoop运行过程详解
- 大数据 T4 Spark基础(附实例分析)
- Spark执行中相关的概念: 有向无环图Directed Acyclic Graph(DAG), lazy evaluation(懒启动)
- Spark架构以及执行过程
- 分布式存储系统:NFS,HDFS
- LSM树,布隆过滤器(Bloom Filter)
- BigTable 与 Hbase
- Cassandra gossiping与负载均衡
- 其他问题
为什么要写这个系列
主要目的是梳理自己的学习内容,并且尝试使用写文章的方式锻炼自己的表达能力。如果能顺便帮助到一些人就更好了。 因为博主本身是学生,所以解决问题的能力和对大数据问题的理解远不如各位已经在这个领域深耕很久前辈。这些文章是我通过 论文,老师课程以及网络课程 进行整理。难免会出现一些错误,希望大家能够指出来,我会尽量进行学习并且更改。