大数据实践指引-1.大数据概述
1.绪论
大数据是什么?
狭义上,是一种规模大到在获取、存储、管理和分析方面大大超出了传统数据库软件工具呢能力范围的数据集合;广义上,是无法在一定时间范围内用常规软件工具进行捕捉、管理和处理,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的信息资产。
大数据的特征
- 数量Volume
- 速度Velocity
- 种类Variety
- 价值Value
- 真实性Veracity
MapReduce
-
两个函数:Map和Reduce
-
核心思想:分而治之
-
设计理念:计算向数据靠拢