学习Python+大数据开发的第一天(小白成长之路)

69 阅读1分钟

1.大数据简介:

万物皆数据

2.大数据解决的问题:

海量数据的存储: Hadoop的HDFS等

海量数据的计算: Hadoop的MR,Spark,Flink等

海量数据的迁移: Sqoop,Flume等

3.大数据特点: 特点: 大 多 值 快 信 大:数据体量大 多:种类和来源多样化 值:低价值密度 快:速度快 信:数据的质量

4.计算机的组成: 计算机组成: 硬件 和 软件

硬件: 冯-诺依曼体系结构(运算器,控制器,输入设备,输出设备,存储器)

软件: 系统软件(操作系统)和应用软件(各种浏览器,播放器,app等)

操作系统的作用: 承上启下 (硬件和应用软件之间的桥梁)

5.编程语言: 编程语言概念: 人和计算机交互的一种语言/方式

编程语言分类: 低级语言 高级语言 面向对象时代

面向对象语言: java 和 python

以python为例: 先根据python语法把自己想要打印的内容放到对应位置:print('你好'),然后python解释器翻译成二进制计算机进行识别

SQL: 结构化查询语言,是一个特殊的编程语言