Hadoop - 不负韶华319的收藏集 - 掘金

Hadoop

不负韶华319

更多收藏集

3篇文章 · 0订阅

Hadoop 学习系列（四）之 MapReduce 原理讲解

本篇文章将会介绍 Hadoop 重要的计算框架 MapReduce。实际运行层面，即算法逻辑作业在分布式主机中是以什么形式和什么流程运行的，因为自 MapReduce version2 以后，作业都是提交给 YARN 进行管理，所以本文将不会介绍此部分。 MapReduce是…

PeTu9465
7年前
14k
30
2

Hadoop小文件解决方案-Hadoop小文件的前因后果

Hadoop不适用于大量小文件，而是需要更少的大文件。这可能是您之前听过的声明。但是，为什么Hadoop会出现大量小文件的问题？而且，“小”究竟是什么意思呢？在本系列的第一部分中，我将回答这些问题。后

qianmoq
3年前
2.3k
点赞
评论

Hadoop小文件解决方案-基于NameNode内存和MapReduce性能解决方案

在第一篇文章中，我讨论了什么构成了一个小文件，以及为什么Hadoop存在小文件问题。我将一个小文件定义为小于Hadoop块大小75％的任何文件，并解释说由于NameNode内存使用和MapReduce

qianmoq
3年前
3.1k
4
评论