Python大数据基础-01

115 阅读1分钟

大数据导论

1.大数据概念

世界的本质是数据 --------大数据研究专家维克托·迈尔-舍恩伯格博士

大数据的定义

大数据(big data) 是指数据量过大,现有的处理工具,处理方法无法对其进行有效高效率的处理,所以需要新处理模式,该处理模式就是大数据.

大数据处理的数据量

图片.png

目前大数据应用,数据量主要集中在PB/EB阶段

大数据主要用来干什么?

大数据用来解决海量数据的存储以及海螺数据的运算,重点在与海量二字.

大数据的特点

可以简单用五个字概括就是:大,多,值,快,信
细说的话:

  1. 大:数据量大
  2. 多:种类和来源多样化
  3. 值:低价值密度(一百万条数据可能只有10条有价值)
  4. 快:数据增长速度快,处理速度快,获取数据的速度快
  5. 信:数据的准确性,数据的可依赖性