Hadoop体系

111 阅读1分钟

第一章 初始hadoop

image.png

1.1 数据!数据

image.png

1ZB = 1000EB = 1000 000PB = 10亿TB

1.2 数据的存储与分析

image.png

image.png

第一个问题:硬件故障问题。

image.png 第二个问题:大数据分析尔任务需要以某种方式结合大部分数据来共同完成分析。

image.png 简而言之:

image.png

1.3 查询所有数据

image.png

1.4 不仅仅是批处理

image.png

image.png

image.png

image.png

image.png

1.5 相比于其它系统的优势

1.5.1 关系型数据管理系统

image.png

image.png

1.5.2 网格计算

image.png

image.png

image.png

第二章 关于MapReduce

第三章 Hadoop分布式文件系统

为什么会有hadoop分布式文件管理系统?

image.png