首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
大数据
订阅
CoderJsk
更多收藏集
微信扫码分享
微信
新浪微博
QQ
5篇文章 · 0订阅
Hadoop学习笔记:一、认识大数据生态体系
Hadoop学习笔记:一、认识大数据生态体系 目标 认识大数据 从Hadoop框架来看大数据生态 1 大数据认知 1.1 部门业务流程 1.2 部门组织架构 2 Hadoop-->大数据生态 2.1
【精通Spark系列】万事开头难?本篇文章让你轻松入门Spark
1.Spark是什么? Apache Spark是专门为大规模数据处理而设计出来的计算引擎,相对于Hadoop MapReduce将结果保存在磁盘中,Spark使用了内存保存中间结果,能在数据尚未写入
【最全的大数据面试系列】Spark面试题大全(一)
1. spark 如何保证宕机迅速恢复? 适当增加 spark standby master 编写 shell 脚本,定期检测 master 状态,出现宕机后对 master 进行重启操作 2.Spa
【最全的大数据面试系列】Hadoop面试题大全(二)
1、HAnamenode 是如何工作的? ZKFailoverController主要职责 1)健康监测:周期性的向它监控的NN发送健康探测命令,从而来确定某个NameNode是否处于健康状态,如果机
【最全的大数据面试系列】Hadoop面试题大全(一)
1、集群的最主要瓶颈 磁盘IO 2、Hadoop运行模式 单机版、伪分布式模式、完全分布式模式 3、HDFS写流程 1)client 客户端发送上传请求,通过 RPC 与 namenode 建立通信,