首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
大数据
订阅
火星上的仙人掌
更多收藏集
微信扫码分享
微信
新浪微博
QQ
3篇文章 · 0订阅
大数据Hadoop入门篇——Hadoop伪分布模式安装 & WordCount 词频统计实现
本文主要记录Mac下如何进行Hadoop伪分布模式安装,并通过词频统计Demo程序(WordCount)理解MapReduce的原理。 Hadoop和Spark是两种不同的大数据处理框架,如下图所示。 上图中的蓝色部分是Hadoop生态系统组件,黄色部分是Spark生态组件。 …
5小时推开Spark的大门——03.WordCount案例
求推荐!大家好,我是一条~ 5小时推开Spark的大门,第三小时,带大家做一个大数据入门的经典案例——WordCount。 话不
hadoop,hive,spark区别
1. hadoop与spark的联系与区别 首先,Hadoop和Apache Spark两者都是大数据框架,但是各自存在的目的不尽相 同。Hadoop实质上更多是一个分布式数据基础设施: 它将巨大的数据集分派到一个由 普通计算机组成的集群中的多个节点进行存储,意味着您不需要购买…