首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
Hadoop
订阅
骑大象的蜗牛
更多收藏集
微信扫码分享
微信
新浪微博
QQ
10篇文章 · 0订阅
【大数据面试题】(一)Hadoop 相关面试题总结
1.由切片数量决定的。2.MR将用户编写的业务逻辑代码和自带的默认组件结合起来组成一个完整的分布式应用程序放到hadoop集群上运行。3.combiner的意义就是对每一个maptask的输出进行局部汇总,以减小网络传输量 partition的默认实现是hashpartitio...
Hadoop 大厂面试题
Hadoop常用端口号 hadoop2.x Hadoop3.x 访问HDFS端口 50070 9870 访问MR执行情况端口 8088 8088 ,Hadoop配置文件以及简单的Hadoop集群搭建
简单介绍 HDFS,MapReduce,Yarn 的 架构思想和原理
大数据技术其实是分布式技术在数据处理领域的创新型应用,其本质就是利用更多的计算机组成一个集群,提供更多的计算资源,从而满足更大的计算压力要求。说的通俗易懂一些,就是大数据技术的诞生解决的就是数据 ..
想要面试大数据工作的50道必看题
摘要:是否对面试官在 Hadoop 面试中可能会问的所有问题感到不知所措?现在是时候通过一系列涵盖 Hadoop 框架不同方面的 Hadoop 面试问题了。
最新Hadoop的面试题总结
最近有好多小伙伴们问我让我整理下Hadoop面试题今天他来了,好好复习迎接新的一年的挑战。 1)Zookeeper:是一个开源的分布式应用程序协调服务,基于zookeeper可以实现同步服务,配置维护,命名服务。 2)Flume:一个高可用的,高可靠的,分布式的海量日志采集、聚…
Hadoop 大厂面试题
这是我参与更文挑战的第27天,活动详情查看:更文挑战 1 Shuffle优化 Map阶段 增大环形缓冲区大小。由100m扩大到200m 增大环形缓冲区溢写的比例。由80%扩大到90% 减少对溢写文件的
【最全的大数据面试系列】Hadoop面试题大全(二)
1、HAnamenode 是如何工作的? ZKFailoverController主要职责 1)健康监测:周期性的向它监控的NN发送健康探测命令,从而来确定某个NameNode是否处于健康状态,如果机
【最全的大数据面试系列】Hadoop面试题大全(一)
1、集群的最主要瓶颈 磁盘IO 2、Hadoop运行模式 单机版、伪分布式模式、完全分布式模式 3、HDFS写流程 1)client 客户端发送上传请求,通过 RPC 与 namenode 建立通信,
大数据面试杀招——Hadoop高频考点,正在刷新你的认知!
本篇文章,让我们有幸一起来阅读一下,该怎么准备Hadoop的内容,才有机会在面试过程占据上风。 这是一个看着不起眼,实则“送命题”的典型。往往大家关于大数据的其他内容准备得非常充分,反倒问你什么是Hadoop却有点猝不及防,回答磕磕绊绊,给面试官的印象就很不好。另外,回答这个问…
Hadoop 学习系列(四)之 MapReduce 原理讲解
本篇文章将会介绍 Hadoop 重要的计算框架 MapReduce。 实际运行层面,即算法逻辑作业在分布式主机中是以什么形式和什么流程运行的,因为自 MapReduce version2 以后,作业都是提交给 YARN 进行管理,所以本文将不会介绍此部分。 MapReduce是…