首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
Hadoop
订阅
Wangsyaa
更多收藏集
微信扫码分享
微信
新浪微博
QQ
4篇文章 · 0订阅
一文读懂MapReduce
Hadoop解决大规模数据分布式计算的方案是MapReduce。MapReduce既是一个编程模型,又是一个计算框架。也就是说,开发人员必须基于MapReduce编程模型进行编程开发,然后将程序通过MapReduce计算框架分发到Hadoop集群中运行。我们先看一下作为编程模型…
带你入坑大数据(二) --- HDFS的读写流程和一些重要策略
Distributed FileSystem顾名思义是一个分布式文件系统,它会通过RPC的方式远程过程调用NameNode里的open方法,这个open方法有什么作用呢,就是获取要读的文件的file block locations,也就是文件的block的位置,在上一讲我们也已…
hadoop-HDFS流程解析
客户端调用DS模块向NameNode请求上传文件。 假设文件为200M,客户端请求上传第一个 Block ,希望得到DataNode服务器位置。 NameNode返回3个DataNode节点,分别为dn1、dn2、dn3,用它们存储数据。 客户端通过FSDataOutputSt…
MapReduce流程解析
MapReduce是一种分布式计算框架,以一种可靠的,具有容错能力的方式并行地处理TB数据级别的海量数据集。MapReduce主要有两个阶段组成:Map和Reduce;用户只需实现map()和reduce()函数,就可实现分布式计算。 MapReduce的核心思想是分治法。将复…