01.前言

162 阅读5分钟

前言

1.数据

是什么

1733591671903.png

价值

1733591706921.png

2.什么是大数据

大数据(Big Data),是指无法在一定时间范围内用常规软件工具进行捕捉,管理(存储)和处理(计算)的数据集合,因此需要新处理模式,该处理模式就是大数据

目前的大数据应用,数据量主要集中在PB/EB级别,涉及的相关单位如下:

1733589808323.png

对超大规模的数据进行处理并挖掘出数据背后的价值的技术体系

大数据的本质是为了解决海量数据的处理难题(处理海量数据的技术)

3.大数据的诞生

计算机相关历史

asdasdfad.png 11111sdasd241208011922.png

00041208012036.png

qqq1208012144.png

231321208012323.png

产生背景

大数据不是突然出现的新事物,而是社会发展的必然产物。随着计算机行业的发展,数据越来越多,从之前的小数据时代逐步进入大数据时代

1741899311698.png

  • 信息技术的进步:智能设备的普及、存储设备性能的提高和网络带宽的增速都是信息技术的进步,它们为大数据的存储和流通提供了物质基础
  • 云计算技术的兴起:云计算技术可以将分散的数据集中在数据中心,使得处理和分析海量数据成为可能。可以说,云计算技术为海量数据存储和访问提供了必要的空间和途径,是大数据诞生的技术基础
  • 数据资源化的趋势:我们将从“科技就是生产力”时代迈向“数据就是生产力”时代。数据逐渐成为现代社会发展的资源,数据资源化的发展趋势是大数据诞生的直接驱动力

单机的问题

1733592302426.png

分布式处理技术

1733592338443.png

1733592457298.png

4.Hadoop体系对于大数据的重要意义

在2008年之前,这些在当时较为高端的分布式技术基本还处于大企业内部专用且不够成熟。在2008年Apache Hadoop开源,广大企业拥有了成熟的,开源的,分布式数据处理解决方案

也就是从2008年开始所谓的大数据技术逐步的走向市场了,Hadoop技术体系如下:

1733592758139.png

5.大数据解决什么问题

1733589867516.png

1733593121308.png

1742006251745.png

6.大数据的特点

1733590452090.png

1733593019036.png

1733593044061.png

1741899478994.png

7.大数据的应用场景

总览

大数据目前已经广泛应用在各行各业中,包括金融大数据、医疗大数据、零售大数据、电商大数据、交通大数据、智慧城市大数据等应用场景

我们平时生活中接触得比较多的大数据应用场景有:

  1. 淘宝、天猫、京东等购物网站中的“猜你喜欢”功能
  2. 百度地图、高德地图中的“实时路况”功能
  3. 今日头条、抖音、直播平台中的“推荐”功能
  4. 美团、饿了么等外卖平台中的“订单实时分配”功能

1733590572962.png

大数据让借贷更放心

1733590652079.png

大数据让广告营销更高效

1733590713840.png

大数据让新媒体更懂你

1733590832117.png

双十一大屏

大屏中的数据是实时统计的,如果等到第2天再统计出来就没有意义了,所以这里需要利用大数据技术实现海量数据的实时采集和计算

1741899664604.png

智慧停车指挥中心

在这里可以统计出实时的停车压力;通过实时监控各个停车场的停车情况实现智能停车,不至于让车主跑了很多个停车场才发现都停满车了。并且,在后期政府规划停车位时,可以根据一段时间内该区域的停车压力进行分析,以决定有没有必要新增车位、增加多少车位合适

通过数据来支持决策是最合理的,也是最准确的

1741899721432.png

公众出行与运营车辆调度

通过系统可以智能调整发车间隔。对于公交车,如果使用传统的定时发车间隔,则会存在一些问题:在高峰时,很多人挤不上车,每一辆车都要等很长时间;而在非高峰时,车辆经常跑空

通过车辆调度系统,可以实现比较好的按需分配:在高峰时,多发一些车;在其他时间,根据各站点的人流量动态调配车辆

1741899767165.png

8.大数据分析的业务步骤

1733590989188.png

9.大数据的发展过程

1742006669214.png

1742006687796.png

1742006707703.png

1742006744043.png

1742006758718.png

1742006785915.png

1742006809549.png

1742006852660.png

1742006889235.png

10.大数据在互联网公司的发展

介绍

咱们以推荐系统作为入口来讲解

PC时代与移动端时代的差异

1742007080920.png

推荐系统需要解决的问题

1742007118558.png

11.大数据软件生态

数据存储生态

1733593325209.png

1733593337970.png

数据计算生态

1733593395491.png

1733593410050.png

数据传输生态

1733593447050.png

1733593470451.png

生态总览图

1741900006361.png

1733593508879.png

12.大数据职业规划

大数据的相关国家政策历史

1733579914890.png

大数据的相关岗位

  • 大数据开发工程师
  • Hadoop开发工程师
  • Spark开发工程师
  • 实时计算开发工程师
  • 数据仓库工程师
  • ETL开发工程师
  • BI开发工程师
  • 数据挖掘工程师
  • 数据架构师

大数据职业方向

1733591131750.png

大数据技能体系

acc132ccc0d8d14343759a1bc94c47ff.png

13.大数据三类岗位

大数据架构

1742007240305.png

1742007257133.png

大数据分析

1742007276263.png

1742007295025.png

大数据开发

1742007316033.png