首页
首页
BOT
沸点
课程
直播
活动
AI刷题
NEW
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
王知无
掘友等级
ლ(′◉❥◉`ლ)
|
Alibaba.com
大数据
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
121
文章 120
沸点 1
赞
121
返回
|
搜索文章
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
1年前
关注
300万字!全网最全大数据学习面试社区等你来
2020年初是我第一次开始把工作中的内容系统性的整理成文章和面试手册,截至目前已经超过300万字,几乎等于一部长篇小说的篇幅。 为什么建一个这样的付费社区?在2022年之前...
赞
评论
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
2年前
关注
「大数据成神之路」第四版更新完毕
《大数据成神之路》第四个版本更新完毕。我们的口号是:为希望从事大数据开发或者由后端转型为大数据开发的工程师们指出需要学习的知识点和路径。...
2
评论
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
3年前
关注
硬刚用户画像 | 标签体系下的用户画像建设小指南
一、 什么是用户画像 用户画像是指根据用户的属性、用户偏好、生活习惯、用户行为等信息而抽象出来的标签化用户模型。通俗说就是给用户打标签,而标签是通过对用户信息分析而来的高度...
10
评论
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
3年前
关注
数仓建模分层理论
从字面上来看,数据仓库就是一个存放数据的仓库,它里面存放了各种各样的数据,而这些数据需要按照一些结构、规则来组织和存放。...
21
3
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
3年前
关注
硬刚Apache Iceberg | 技术调研&在各大公司的实践应用大总结
作者在实际工作中调研了Iceberg的一些优缺点和在各大厂的应用,总结在下面。希望能给大家带来一些启示。...
2
评论
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
3年前
关注
硬刚 Presto | Presto 原理 & 调优 & 面试 & 实战全面升级版
很久之前,曾经写过一篇 《Presto在大数据领域的实践和探索》 。文中详细讲解了Presto的原理和应用。 今天这篇文章是升级版本,把我个人读过的文章和书籍的笔记进行了系...
5
评论
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
3年前
关注
硬刚Hbase - 17道题你能秒我?我Hbase八股文反手就甩你一脸
Hbase为了解决大数据环境中海量结构化数据的实时读写问题。为了弥补hadoop生态中没有实时存储的缺陷。...
赞
评论
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
3年前
关注
所以说读者们才是最优秀的 | 某读者喜提offer后的分享
这是小编的一个读者喜提offer后在群里做的分享,文中隐藏了读者的个人隐私信息,小编这里把他的面经分享出来供大家学习。群友们看到后都纷纷表示【我酸了,现在我就是个柠檬精系列...
1
2
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
3年前
关注
所以说读者们才是最优秀的 | 某读者喜提offer后的分享
这是小编的一个读者喜提offer后在群里做的分享,文中隐藏了读者的个人隐私信息,小编这里把他的面经分享出来供大家学习。群友们看到后都纷纷表示【我酸了,现在我就是个柠檬精系列...
赞
3
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
3年前
关注
2021年,开发者的落日
小说《三体》第一部结尾,叶文洁透过红岸基地天空看到了最后一次日落。她亲手发出的讯息让人类太阳永远沉沦。多年以后,一颗小小的水滴瞬间摧毁庞大的人类星际舰队,人类的骄傲与自尊灰...
1
2
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
3年前
关注
【大数据哔哔集20210117】Kafka 的高可靠性是怎么实现的
数据可靠性 Kafka 作为一个商业级消息中间件,消息可靠性的重要性可想而知。本文从 Producter 往 Broker 发送消息、Topic 分区副本以及 Leader...
赞
评论
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
3年前
关注
【大数据哔哔集20210124】有人问我Kafka Leader选举?我真没慌
一条消息只有被ISR中所有Follower都从Leader复制过去才会被认为已提交。这样就避免了部分数据被写进了Leader,还没来得及被任何Follower复制就宕机了,...
赞
评论
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
3年前
关注
数据倾斜?Spark 3.0 AQE专治各种不服
Spark3.0已经发布半年之久,这次大版本的升级主要是集中在性能优化和文档丰富上,其中46%的优化都集中在SparkSQL上,SQL优化里最引人注意的非AdaptiveQ...
1
评论
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
3年前
关注
数据倾斜?Spark 3.0 AQE专治各种不服
Spark3.0已经发布半年之久,这次大版本的升级主要是集中在性能优化和文档丰富上,其中46%的优化都集中在SparkSQL上,SQL优化里最引人注意的非AdaptiveQ...
1
评论
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
3年前
关注
阿里大数据一次简单而失败的面试题回忆
一面简单介绍一下自己以及自己做过的项目;JavaHashMap是不是线程安全的?为什么?请用Java写个单例模式知道几种GC算法?如何实现一个高效的单项列表逆向输出?数据湖...
赞
评论
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
3年前
关注
【大数据哔哔集20210122】面试官问我HDFS丢不丢数据?我啪就把这个文章甩到他脸上
数据一致性HDFS作为分布式文件系统在分布式环境下如何保证数据一致性。HDFS中,存储的文件将会被分成若干的大小一致的block分布式地存储在不同的机器上,需要NameNo...
赞
评论
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
3年前
关注
【大数据哔哔集20210123】别问,问就是Kafka最可靠
Kafka的高可靠性的保障来源于其健壮的副本(replication)策略。通过调节其副本相关参数,可以使得Kafka在性能和可靠性之间运转的游刃有余。Kafka从0.8....
赞
评论
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
3年前
关注
Sorry!Hbase的LSM Tree就是可以为所欲为!
我们先抛出一个问题:LSM树是HBase里使用的非常有创意的一种数据结构。在有代表性的关系型数据库如MySQL、SQLServer、Oracle中,数据存储与索引的基本结构...
2
2
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
3年前
关注
【大数据面试之对线面试官】MapReduce/HDFS/YARN面试题70连击
热身30题1.描述一下HDFS的写流程2.描述一下HDFS的读流程3.详细讲解一下HDFS的体系结构4.如果一个datanode出现宕机,恢复流程是什么样的?5.通常你是如...
3
1
分享
下一页
个人成就
优秀创作者
文章被点赞
687
文章被阅读
248,119
掘力值
6,062
关注了
0
关注者
536
收藏集
2
关注标签
9
加入于
2019-02-10