所谓大数据(Big Data),就是需要处理的数据量非常巨大,已经达到了 TB、PB 甚至 EB、ZB 级别,需要成千上万块硬盘才能存储。传统的技术手段在大数据面前不堪一击,只能探索一套新的解决方案。
这套《大数据技术与应用教程》对大数据处理过程中涉及的各种关键技术做了详细的介绍,包括大数据思维、大数据采集、大数据处理、大数据存储、大数据挖掘、大数据应用等各个环节,帮助初学者规划了一条完整的学习路线。
这套教程只是一本入门指南手册,目的是给初学者指引方向,它虽然讲解了大数据的各种技术,但并不非常深入。对于大数据开发人员,还需要结合其它教程深度学习;对于大数据从业者,这些知识已经足够了。
- 大数据是什么?1分钟了解大数据的概念!
- 大数据时代是什么意思?
- 大数据的产生和作用(详细分析)
- 大数据时代的10个重大变化(长篇神文)
- 大数据处理的基本流程:数据抽取与集成+数据分析+数据解释
- 大数据开发涉及到的关键技术有哪些?
- 大数据采集技术概述
- 通过系统日志采集大数据
- Scrapy网络爬虫简介
- 通过网络爬虫采集大数据
- 大数据预处理架构和方法简介
- 大数据预处理之数据清洗
- 大数据预处理之数据集成
- 大数据预处理之数据转换
- 大数据预处理之数据消减
- 离散化和数值概念层次树简介
- 大数据处理技术有哪些?
- GFS、MapReduce和BigTable:Google的三种大数据处理系统
- Hadoop大数据处理框架简介
- Hadoop HDFS分布式文件系统简介
- HDFS基本原理和设计理念
- HDFS架构和实现机制简介
- HDFS读取和写入数据简介
- HDFS两种操作方式:命令行和Java API
- NoSQL非关系型数据库简介
- NoSQL数据库类型简介
- Hadoop HBase数据库简介
- HBase列式数据模型简介
- HBase Shell常用命令和基本操作(附带实例)
- HBase主要运行机制(物理存储和逻辑架构)
- HBase常用Java API
- HBase Java API编程实例
- Hadoop MapReduce简介
- Hadoop MapReduce架构
- Hadoop MapReduce工作流程
- MapReduce编程实例:单词计数
- MapReduce执行流程和Shuffle过程
- MapReduce实例分析:单词计数
- Spark是什么?Spark和Hadoop的区别
- Spark RDD是什么?
- Spark总体架构和运行流程
- Spark生态圈简介
- Spark开发实例(编程实践)
- Spark Streaming简介
- Spark Streaming的系统架构
- Spark Streaming编程模型
- Spark DStream相关操作
- Spark Streaming编程实战(开发实例)
- 数据挖掘是什么?
- Spark MLlib简介
- 数据挖掘之分类和预测简介
- 决策树和朴素贝叶斯算法简介
- 回归分析预测技术简介
- 什么是聚类分析?聚类分析方法的类别
- k-means聚类算法简介
- DBSCAN聚类算法简介
- 数据挖掘之关联规则分析简介
- Apriori算法和FP-Tree算法简介
- 基于大数据的精准营销
- 基于大数据的个性化推荐系统
- 大数据预测(大数据核心应用)
- 大数据的其他应用领域
- 大数据可以应用在哪些行业?
- 大数据在金融行业的应用
- 大数据在互联网行业的应用
- 大数据在物流行业的应用