大数据 - 归零788的收藏集 - 掘金

大数据

更多收藏集

3篇文章 · 0订阅

一文读懂MapReduce

Hadoop解决大规模数据分布式计算的方案是MapReduce。MapReduce既是一个编程模型，又是一个计算框架。也就是说，开发人员必须基于MapReduce编程模型进行编程开发，然后将程序通过MapReduce计算框架分发到Hadoop集群中运行。我们先看一下作为编程模型…

王知无
6年前
17k
44
2

一、HIVE是什么二、Hive的优缺点2.1 优点2.三、Hive结构原理四、 Hive和数据库比较4.1 查询语言4.2 数据存储位置4.3 数据更新4.4 索引4.5 执行4.6 执行延迟4.7 可扩展性4. Hive 是一个基于Hadoop文件系统之上的数据仓库架构。它为...

宝哥大数据
4年前
528
点赞
评论

一文读懂Apache Flink技术

Flink是一款分布式的计算引擎，它可以用来做批处理，即处理静态的数据集、历史的数据集；也可以用来做流处理，即实时地处理一些实时数据流，实时地产生数据的结果；也可以用来做一些基于事件的应用，比如说滴滴通过Flink CEP实现实时监测用户及司机的行为流来判断用户或司机的行为是否…

Flink_China
7年前
14k
42
4