前言
1.数据
是什么
价值
2.什么是大数据
大数据(Big Data),是指无法在一定时间范围内用常规软件工具进行捕捉,管理(存储)和处理(计算)的数据集合,因此需要新处理模式,该处理模式就是大数据
目前的大数据应用,数据量主要集中在PB/EB级别,涉及的相关单位如下:
对超大规模的数据进行处理并挖掘出数据背后的价值的技术体系
大数据的本质是为了解决海量数据的处理难题(处理海量数据的技术)
3.大数据的诞生
计算机相关历史
产生背景
大数据不是突然出现的新事物,而是社会发展的必然产物。随着计算机行业的发展,数据越来越多,从之前的小数据时代逐步进入大数据时代
- 信息技术的进步:智能设备的普及、存储设备性能的提高和网络带宽的增速都是信息技术的进步,它们为大数据的存储和流通提供了物质基础
- 云计算技术的兴起:云计算技术可以将分散的数据集中在数据中心,使得处理和分析海量数据成为可能。可以说,云计算技术为海量数据存储和访问提供了必要的空间和途径,是大数据诞生的技术基础
- 数据资源化的趋势:我们将从“科技就是生产力”时代迈向“数据就是生产力”时代。数据逐渐成为现代社会发展的资源,数据资源化的发展趋势是大数据诞生的直接驱动力
单机的问题
分布式处理技术
4.Hadoop体系对于大数据的重要意义
在2008年之前,这些在当时较为高端的分布式技术基本还处于大企业内部专用且不够成熟。在2008年Apache Hadoop开源,广大企业拥有了成熟的,开源的,分布式数据处理解决方案
也就是从2008年开始所谓的大数据技术逐步的走向市场了,Hadoop技术体系如下:
5.大数据解决什么问题
6.大数据的特点
7.大数据的应用场景
总览
大数据目前已经广泛应用在各行各业中,包括金融大数据、医疗大数据、零售大数据、电商大数据、交通大数据、智慧城市大数据等应用场景
我们平时生活中接触得比较多的大数据应用场景有:
- 淘宝、天猫、京东等购物网站中的“猜你喜欢”功能
- 百度地图、高德地图中的“实时路况”功能
- 今日头条、抖音、直播平台中的“推荐”功能
- 美团、饿了么等外卖平台中的“订单实时分配”功能
大数据让借贷更放心
大数据让广告营销更高效
大数据让新媒体更懂你
双十一大屏
大屏中的数据是实时统计的,如果等到第2天再统计出来就没有意义了,所以这里需要利用大数据技术实现海量数据的实时采集和计算
智慧停车指挥中心
在这里可以统计出实时的停车压力;通过实时监控各个停车场的停车情况实现智能停车,不至于让车主跑了很多个停车场才发现都停满车了。并且,在后期政府规划停车位时,可以根据一段时间内该区域的停车压力进行分析,以决定有没有必要新增车位、增加多少车位合适
通过数据来支持决策是最合理的,也是最准确的
公众出行与运营车辆调度
通过系统可以智能调整发车间隔。对于公交车,如果使用传统的定时发车间隔,则会存在一些问题:在高峰时,很多人挤不上车,每一辆车都要等很长时间;而在非高峰时,车辆经常跑空
通过车辆调度系统,可以实现比较好的按需分配:在高峰时,多发一些车;在其他时间,根据各站点的人流量动态调配车辆
8.大数据分析的业务步骤
9.大数据的发展过程
10.大数据在互联网公司的发展
介绍
咱们以推荐系统作为入口来讲解
PC时代与移动端时代的差异
推荐系统需要解决的问题
11.大数据软件生态
数据存储生态
数据计算生态
数据传输生态
生态总览图
12.大数据职业规划
大数据的相关国家政策历史
大数据的相关岗位
- 大数据开发工程师
- Hadoop开发工程师
- Spark开发工程师
- 实时计算开发工程师
- 数据仓库工程师
- ETL开发工程师
- BI开发工程师
- 数据挖掘工程师
- 数据架构师