首页
AI Coding
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
王知无
掘友等级
ლ(′◉❥◉`ლ)
|
Alibaba.com
大数据
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
121
文章 120
沸点 1
赞
121
返回
|
搜索文章
最新
热门
【大数据哔哔集20210117】Kafka 的高可靠性是怎么实现的
数据可靠性 Kafka 作为一个商业级消息中间件,消息可靠性的重要性可想而知。本文从 Producter 往 Broker 发送消息、Topic 分区副本以及 Leader 选举几个角度介绍数据的可靠
【大数据哔哔集20210124】有人问我Kafka Leader选举?我真没慌
一条消息只有被ISR中所有Follower都从Leader复制过去才会被认为已提交。这样就避免了部分数据被写进了Leader,还没来得及被任何Follower复制就宕机了,而造成数据丢失。而对于Pro
数据倾斜?Spark 3.0 AQE专治各种不服
Spark3.0已经发布半年之久,这次大版本的升级主要是集中在性能优化和文档丰富上,其中46%的优化都集中在SparkSQL上,SQL优化里最引人注意的非AdaptiveQueryExecution莫
数据倾斜?Spark 3.0 AQE专治各种不服
Spark3.0已经发布半年之久,这次大版本的升级主要是集中在性能优化和文档丰富上,其中46%的优化都集中在SparkSQL上,SQL优化里最引人注意的非AdaptiveQueryExecution莫
阿里大数据一次简单而失败的面试题回忆
一面简单介绍一下自己以及自己做过的项目;JavaHashMap是不是线程安全的?为什么?请用Java写个单例模式知道几种GC算法?如何实现一个高效的单项列表逆向输出?数据湖和数据仓库有什么区别?详细介
【大数据哔哔集20210122】面试官问我HDFS丢不丢数据?我啪就把这个文章甩到他脸上
数据一致性HDFS作为分布式文件系统在分布式环境下如何保证数据一致性。HDFS中,存储的文件将会被分成若干的大小一致的block分布式地存储在不同的机器上,需要NameNode节点来对这些数据进行管理
【大数据哔哔集20210123】别问,问就是Kafka最可靠
Kafka的高可靠性的保障来源于其健壮的副本(replication)策略。通过调节其副本相关参数,可以使得Kafka在性能和可靠性之间运转的游刃有余。Kafka从0.8.x版本开始提供Partition级别的复制,replication数量可以配置文件(default.rep…
Sorry!Hbase的LSM Tree就是可以为所欲为!
我们先抛出一个问题:LSM树是HBase里使用的非常有创意的一种数据结构。在有代表性的关系型数据库如MySQL、SQLServer、Oracle中,数据存储与索引的基本结构就是我们耳熟能详的B树和B+
【大数据面试之对线面试官】MapReduce/HDFS/YARN面试题70连击
热身30题1.描述一下HDFS的写流程2.描述一下HDFS的读流程3.详细讲解一下HDFS的体系结构4.如果一个datanode出现宕机,恢复流程是什么样的?5.通常你是如何解决Haddop的Name
2021年最新版大数据面试题全面总结-持续更新
更新内容和时间表大数据基础篇Part0:Java基础篇Part1:Java高级篇Part2:Java之JVM篇Part3:NIO和Netty篇Part4:分布式理论篇框架篇Part5:Hadoop之M
下一页
个人成就
优秀创作者
文章被点赞
697
文章被阅读
270,244
掘力值
6,141
关注了
0
关注者
536
收藏集
2
关注标签
9
加入于
2019-02-10