第一章 初始hadoop
1.1 数据!数据
1ZB = 1000EB = 1000 000PB = 10亿TB
1.2 数据的存储与分析
第一个问题:硬件故障问题。
第二个问题:大数据分析尔任务需要以某种方式结合大部分数据来共同完成分析。
简而言之:
1.3 查询所有数据
1.4 不仅仅是批处理
1.5 相比于其它系统的优势
1.5.1 关系型数据管理系统
1.5.2 网格计算
第二章 关于MapReduce
第三章 Hadoop分布式文件系统
为什么会有hadoop分布式文件管理系统?