大数据 - 火星上的仙人掌的收藏集 - 掘金

大数据

火星上的仙人掌

更多收藏集

3篇文章 · 0订阅

大数据Hadoop入门篇——Hadoop伪分布模式安装 & WordCount 词频统计实现

本文主要记录Mac下如何进行Hadoop伪分布模式安装，并通过词频统计Demo程序(WordCount)理解MapReduce的原理。 Hadoop和Spark是两种不同的大数据处理框架，如下图所示。上图中的蓝色部分是Hadoop生态系统组件，黄色部分是Spark生态组件。 …

变速风声
5年前
2.2k
3
评论

5小时推开Spark的大门——03.WordCount案例

求推荐！大家好，我是一条~ 5小时推开Spark的大门，第三小时，带大家做一个大数据入门的经典案例——WordCount。话不

一条coding
4年前
6.2k
26
评论

hadoop,hive,spark区别

1. hadoop与spark的联系与区别首先，Hadoop和Apache Spark两者都是大数据框架，但是各自存在的目的不尽相同。Hadoop实质上更多是一个分布式数据基础设施: 它将巨大的数据集分派到一个由普通计算机组成的集群中的多个节点进行存储，意味着您不需要购买…

陈浮生
6年前
5.1k
7
1