首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
王知无
掘友等级
ლ(′◉❥◉`ლ)
|
Alibaba.com
大数据
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
121
文章 120
沸点 1
赞
121
返回
|
搜索文章
最新
热门
【大数据面试题】Flink第一弹60连发
感谢胖子大佬提供的企业面试题。本文因为时间关系只有部分答案,后续的答案小编会持续补全,请持续关注本系列。年后升职加薪就靠它了。胖子大佬就在交流群里,需要加群的公众号回复【加群】。更多面试题可以参考:《
企业大数据平台仓库架构建设思路
本文根据阿里云高级技术专家李金波在首届阿里巴巴在线峰会的《企业大数据平台仓库架构建设思路》的分享整理而成。随着互联网规模不断的扩大,数据也在爆炸式地增长,各种结构化、半结构化、非结构化数据的产生,越来
企业大数据平台仓库架构建设思路
本文根据阿里云高级技术专家李金波在首届阿里巴巴在线峰会的《企业大数据平台仓库架构建设思路》的分享整理而成。随着互联网规模不断的扩大,数据也在爆炸式地增长,各种结构化、半结构化、非结构化数据的产生,越来
【大数据哔哔集20210108】Spark Shuffle 和 Hadoop Shuffle有什么异同?
Shuffle的本意是洗牌、混洗的意思,把一组有规则的数据尽量打乱成无规则的数据。而在MapReduce中,Shuffle更像是洗牌的逆过程,指的是将map端的无规则输出按指定的规则“打乱”成具有一定
学不会去当产品吧?Flink实战任务调优
背景在大数据领域我们都知道,开发是最简单,任务的合理调优、问题排查才是最重要的。我们在之前的文章《Flink面试通关手册》中也讲解过,作者结合线上出现的一些问题,总结了一些任务调优需要注意的点。一些简
Presto在大数据领域的实践和探索
小编在去年的时候,写过一篇轰动全网的文章《你需要的不是实时数仓|你需要的是一款强大的OLAP数据库》,这篇文章当时被各大门户网站和自媒体疯狂转载,保守阅读量也在50万+UV,在这篇文章中提到过Pret
PDFT/Paxos/Raft-分布式一致性协议解析
分布式系统中有个著名的原则CAP原则,C为Consistency(一致性)、A为Availability(可用性)、P为Partitiontolerance(分区容错性)。这里主要介绍下分布式环境下如
Flink事件时间、水印和迟到数据处理
事件时间与水印所谓事件时间,就是FlinkDataStream中的数据元素自身带有的、在其实际发生时记录的时间戳,具有业务含义,并与系统时间独立。很显然,由于外部系统产生的数据往往不能及时、按序到达F
Flink1.10和Hive集成需要注意的点
前几天,Flink官方release了Flink1.10版本,这个版本有很多改动。比如:其中最重要的一个特性之一是:推出了生产可用的Hive集成。Flink1.9中推出了预览版的Hive集成。该版本允
圆形缓冲区-MapReduce中的
这篇文章来自一个读者在面试过程中的一个问题,Hadoop在shuffle过程中使用了一个数据结构-环形缓冲区。环形队列是在实际编程极为有用的数据结构,它是一个首尾相连的FIFO的数据结构,采用数组的线
下一页
个人成就
优秀创作者
文章被点赞
697
文章被阅读
277,054
掘力值
6,160
关注了
0
关注者
537
收藏集
2
关注标签
9
加入于
2019-02-10