首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
蓦然_
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
2
文章 2
沸点 0
赞
2
返回
|
搜索文章
蓦然_
2年前
关注
大数据面试题:说下Spark中的Transform和Action,为什么Spark要把操作分为Transform和Action?
Transform和Action Transformation是得到一个新的RDD,但并不立即执行计算,只是记录下这个操作。方式很多,比如从数据源生成一个新的RDD,从RD...
0
评论
分享
蓦然_
2年前
关注
大数据面试题:Kafka的ISR机制
ISR是Leader维护的一个动态副本同步队列,是和Leader保持同步的Follower集合。Kafka通过多副本来保证消息不丢失。...
0
评论
分享
蓦然_
2年前
关注
大数据面试题:HBase的读写缓存
HBase上RegionServer的cache主要分为两个部分:MemStore & BlockCache。 MemStore是写缓存,BlockCache是读缓存。...
1
评论
分享
蓦然_
2年前
关注
大数据面试题:HBase的RegionServer宕机以后怎么恢复的?
HBase故障恢复流程的总结如下方内容: - 故障检测 - 数据切分 - region上线 - 数据回放...
0
评论
分享
蓦然_
2年前
关注
大数据面试题:Kafka的ISR、OSR和ACK介绍,ACK分别有几种值?
ISR(In-Sync Replicas):副本同步队列 ISR是Leader维护了一个动态副本同步队列,是和leader保持同步的follower集合。...
0
评论
分享
蓦然_
2年前
关注
大数据面试题:Hive count(distinct)有几个reduce,海量数据会有什么问题?
count(distinct)只有1个reduce。 为什么只有一个reducer呢,因为使用了distinct和count(full aggreates),这两个函数产生...
0
评论
分享
蓦然_
2年前
关注
大数据面试题:超详细版MapReduce工作原理
大数据面试题:超详细版MapReduce工作原理 1、准备待处理文件 2、submit()对原始文件进行切片分析...
0
评论
分享
蓦然_
2年前
举报
#新人报道#
大数据开发学习资料、面试题分享
分享
评论
点赞
蓦然_
2年前
关注
大数据面试题:Kafka怎么保证数据不丢失,不重复?
大数据面试题:Kafka怎么保证数据不丢失,不重复? 存在数据丢失的几种情况 使用同步模式的时候,有3种状态保证消息被安全生产,在配置为1(只保证写入leader成功)的话...
0
评论
分享
蓦然_
2年前
关注
《阿里大数据之路》读书笔记:第一章 总述
阿里数据体系主要分为数据采集、数据计算、数据服务和数据应用四大层次。 阿里巴巴建立了一套标准的数据采集体系方案,致力全面、高性能、规范地完成海量数据的采集,并将其传输到大数...
0
评论
分享
蓦然_
2年前
关注
《阿里大数据之路》读书笔记:第二章 日志采集
《阿里大数据之路》读书笔记:第二章 日志采集 浏览器的页面型产品/服务的日志采集可分为两大类:页面浏览(展现)日志采集和页面交互日志采集...
1
评论
分享
蓦然_
2年前
关注
大数据面试题:Kafka的一条message中包含了哪些信息?
面试题来源: 《大数据面试题 V4.0》 大数据面试题V3.0,523道题,679页,46w字 大数据面试题:Kafka的一条message中包含了哪些信息?...
0
评论
分享
蓦然_
关注了标签
大数据
蓦然_
4年前
关注
我的大数据学习之路
要从事计算机行业的工作,不管是什么工作,开发、测试、还是算法等,都是要有一门自己比较熟练的编程语言,编程语言可以是C语言、Java、C++等,只要是和你后续工作所相关的就可...
1
3
分享
蓦然_
关注了标签
Apache
蓦然_
关注了标签
Eclipse
蓦然_
关注了标签
Java
蓦然_
关注了标签
算法
蓦然_
关注了标签
面试
蓦然_
关注了标签
GitHub
下一页
个人成就
文章被点赞
3
文章被阅读
2,847
掘力值
136
关注了
0
关注者
0
收藏集
0
关注标签
12
加入于
2020-11-20