#每天一个知识点# MapReduce 是一种编程模型,用于大规模数据集(大于 1TB)的并行运算。MapReduce 由 Google 公司提出,用于解决大规模数据集的并行运算问题。MapReduce 有两个基本操作,即 Map 和 Reduce。Map 操作由用户自定义,Reduce 操作由系统自动生成。MapReduce 通过将大规模数据集分割成若干个小数据集,然后在小数据集上进行 Map 操作,最后将 Map 操作的结果进行 Reduce 操作,从而得到最终结果。
展开
评论