1、怎么去理解大数据?
人们常说大数据啊、大数据。我个人认为这个大数据是指如今的大数据时代。那么这个大数据时代怎么理解呢?①海量数据:随着互联网的普及,人们生产生活产生了达到PB、EB级别的海量数据,而这些数据没有办法在一定的时间范围内被常规的软件工具进行捕获、管理和处理;②分析挖掘:如此庞大的数据,数据与数据之间有没有关系呢?能揭示什么规律,对于总结历史经验和预测未来有哪些帮助,能不能为我们的决策提供支持等。
2、大数据具备哪些特点呢?
1、Volume(大量):举个简单的例子:人类生产的所有印刷材料的数据量是200PB、而历史上全人类总共说过的话的数据量大约是5EB。当前、典型个人计算机硬盘的容量为TB量级,而一些大企业的数据量已经接近EB量级。
2、Velocity(高速):这是大数据区分于传统数据挖掘的最显著的特征。根据IDC的“数字宇宙”的报告,预计到2025年,全球数据使用量将达到163ZB。在如此海量的数据面前,处理数据的效率就是企业的生命。
3、Variety(多样):这种类型的多样性也让数据被分为结构化数据和非结构化数据。相对于以往便于存储的以数据库/文本为主的结构化数据、非结构化数据越来越多,包括网络日志、音频、视频、图片、地理位置信息等,这些多类型的数据对数据的处理能力提出了更高的要求。
4、Value(低价值密度):价值密度的高低与数据总量的大小成反比。比如:在一天监控视频中,我们只关心宋老师晚上在床上健身那一分钟,如何快速对有价值数据“提纯”成为目前大数据背景下待解决的难题。
3、大数据应用场景?
1、抖音:推荐的都是你喜欢的视频
2、电商站内广告推荐:给每个用户推荐可能喜欢的商品
3、零售:分析用户消费习惯,为用户购买商品提供方便,从而提升商品销量。
经典案例:尿不湿+啤酒。