大数据 - CoderJsk的收藏集 - 掘金

大数据

更多收藏集

5篇文章 · 0订阅

Hadoop学习笔记：一、认识大数据生态体系

Hadoop学习笔记：一、认识大数据生态体系目标认识大数据从Hadoop框架来看大数据生态 1 大数据认知 1.1 部门业务流程 1.2 部门组织架构 2 Hadoop-->大数据生态 2.1

火航
4年前
2.8k
6
评论

【精通Spark系列】万事开头难？本篇文章让你轻松入门Spark

1.Spark是什么？ Apache Spark是专门为大规模数据处理而设计出来的计算引擎，相对于Hadoop MapReduce将结果保存在磁盘中，Spark使用了内存保存中间结果，能在数据尚未写入

大数据小禅
4年前
547
30
评论

【精通Spark系列】万事开头难？本篇文章让你轻松入门Spark

【最全的大数据面试系列】Spark面试题大全（一）

1. spark 如何保证宕机迅速恢复? 适当增加 spark standby master 编写 shell 脚本，定期检测 master 状态，出现宕机后对 master 进行重启操作 2.Spa

大数据小禅
4年前
970
24
评论

【最全的大数据面试系列】Spark面试题大全（一）

【最全的大数据面试系列】Hadoop面试题大全（二）

1、HAnamenode 是如何工作的? ZKFailoverController主要职责 1）健康监测：周期性的向它监控的NN发送健康探测命令，从而来确定某个NameNode是否处于健康状态，如果机

大数据小禅
4年前
1.8k
5
评论

【最全的大数据面试系列】Hadoop面试题大全（二）

【最全的大数据面试系列】Hadoop面试题大全（一）

1、集群的最主要瓶颈磁盘IO 2、Hadoop运行模式单机版、伪分布式模式、完全分布式模式 3、HDFS写流程 1）client 客户端发送上传请求，通过 RPC 与 namenode 建立通信，

大数据小禅
4年前
3.2k
33
评论

【最全的大数据面试系列】Hadoop面试题大全（一）