首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
王知无
掘友等级
ლ(′◉❥◉`ლ)
|
Alibaba.com
大数据
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
121
文章 120
沸点 1
赞
121
返回
|
搜索文章
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
4年前
关注
2021年最新版大数据面试题全面总结-持续更新
更新内容和时间表大数据基础篇Part0:Java基础篇Part1:Java高级篇Part2:Java之JVM篇Part3:NIO和Netty篇Part4:分布式理论篇框架篇...
1
评论
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
4年前
关注
【大数据面试题】Flink第一弹60连发
感谢胖子大佬提供的企业面试题。本文因为时间关系只有部分答案,后续的答案小编会持续补全,请持续关注本系列。年后升职加薪就靠它了。胖子大佬就在交流群里,需要加群的公众号回复【加...
0
评论
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
4年前
关注
企业大数据平台仓库架构建设思路
本文根据阿里云高级技术专家李金波在首届阿里巴巴在线峰会的《企业大数据平台仓库架构建设思路》的分享整理而成。随着互联网规模不断的扩大,数据也在爆炸式地增长,各种结构化、半结构...
1
评论
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
4年前
关注
企业大数据平台仓库架构建设思路
本文根据阿里云高级技术专家李金波在首届阿里巴巴在线峰会的《企业大数据平台仓库架构建设思路》的分享整理而成。随着互联网规模不断的扩大,数据也在爆炸式地增长,各种结构化、半结构...
1
评论
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
4年前
关注
【大数据哔哔集20210108】Spark Shuffle 和 Hadoop Shuffle有什么异同?
Shuffle的本意是洗牌、混洗的意思,把一组有规则的数据尽量打乱成无规则的数据。而在MapReduce中,Shuffle更像是洗牌的逆过程,指的是将map端的无规则输出按...
1
评论
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
4年前
关注
学不会去当产品吧?Flink实战任务调优
背景在大数据领域我们都知道,开发是最简单,任务的合理调优、问题排查才是最重要的。我们在之前的文章《Flink面试通关手册》中也讲解过,作者结合线上出现的一些问题,总结了一些...
0
评论
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
4年前
关注
Presto在大数据领域的实践和探索
小编在去年的时候,写过一篇轰动全网的文章《你需要的不是实时数仓|你需要的是一款强大的OLAP数据库》,这篇文章当时被各大门户网站和自媒体疯狂转载,保守阅读量也在50万+UV...
2
评论
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
5年前
关注
PDFT/Paxos/Raft-分布式一致性协议解析
分布式系统中有个著名的原则CAP原则,C为Consistency(一致性)、A为Availability(可用性)、P为Partitiontolerance(分区容错性)。...
1
2
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
5年前
关注
Flink事件时间、水印和迟到数据处理
事件时间与水印所谓事件时间,就是FlinkDataStream中的数据元素自身带有的、在其实际发生时记录的时间戳,具有业务含义,并与系统时间独立。很显然,由于外部系统产生的...
1
评论
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
5年前
关注
Flink1.10和Hive集成需要注意的点
前几天,Flink官方release了Flink1.10版本,这个版本有很多改动。比如:其中最重要的一个特性之一是:推出了生产可用的Hive集成。Flink1.9中推出了预...
2
评论
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
5年前
关注
圆形缓冲区-MapReduce中的
这篇文章来自一个读者在面试过程中的一个问题,Hadoop在shuffle过程中使用了一个数据结构-环形缓冲区。环形队列是在实际编程极为有用的数据结构,它是一个首尾相连的FI...
0
评论
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
5年前
关注
Flink整合Oozie Shell Action 提交任务带Kerberos认证
最近这段时间一直在忙新集群迁移,上了最新的cdh6.3.0于是Flink提交遇到了许多的问题,还好有clouderaLicense有了原厂的帮助和社区的伙伴,问题解决起来快...
0
评论
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
5年前
关注
Data Lake 三剑客—Delta、Hudi、Iceberg 对比分析
本文来源于云栖社区:https://yq.aliyun.com/articles/743514作者:xy_xin共同点定性上讲,三者均为DataLake的数据存储中间层,其...
2
评论
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
5年前
关注
Spark源码阅读的正确打开方式
Spark发展至今,应该说已经非常成熟了。是大数据计算领域不得不学习的框架。尤其是Spark在稳定性和社区发展的成熟度方面,吊打其他的大数据处理框架。Spark至今只经历过...
1
评论
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
5年前
关注
大数据量下寻找相邻单词的数量
这题目和Leetcode中的一些搜索题目有点类似。想处理的问题是:统计一个单词相邻前后两位的数量,如有w1,w2,w3,w4,w5,w6,则:最终要输出为(word,nei...
0
评论
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
5年前
关注
我读过的一些书推荐
本文总结了一些读书的时候和工作后看过的书,这些书是从我的书单中挑出来的。不完全统计我个人在京东、当当、亚马逊和Kindle上共买了几百本书,当然算起来其实没有花多少钱,有大...
1
评论
分享
王知无
ლ(′◉❥◉`ლ) @Alibaba.com
·
5年前
关注
阿里巴巴的全链路压测
双十一从2009诞生到现在,2013年绝对是一个分水岭。为什么这么说?因为2013有了全链路压测。每年的11月11日00:00:00,阿里巴巴集团最紧张激动的时刻到来了。多...
2
评论
分享
下一页
个人成就
优秀创作者
文章被点赞
697
文章被阅读
266,474
掘力值
6,130
关注了
0
关注者
535
收藏集
2
关注标签
9
加入于
2019-02-10