首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Flink实战剖析
掘友等级
crud & sql
公众号|Flink实战剖析
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
4
文章 4
沸点 0
赞
4
返回
|
搜索文章
赞
文章( 4 )
沸点( 0 )
Count-Distinct实践: 万亿级数据量任务优化方式
join实践: 万亿级数据量任务优化历程 单字段去重 先看一个简单的sql ,pv_id 去重计数 在默认情况下,相同的visit_type 的pv_id 会被分配到同一个reducer中处理,如果某
join实践: 万亿级数据量任务优化历程
优化前 大概执行2h, 还未得出结果。 第一次优化 暴力增加join 的并行度, 没有什么优化是比加资源来得更直接。 大概执行2h, 仍未得出结果。 第二次优化 重新分析两张表数据量,a 表数据量
Flink系列目录
散记系列目录:一、你应该了解的Watermark二、Flink中延时调用设计与实现三、FlinkSQL中可撤回机制解密时间系统系列目录:一、时间系统概述介绍二、ProcessingTime源码分析三、
JVM篇之java内存模型
在并发编程中,我们通常要处理两个问题:线程之前如何通信与线程之间如何同步。 同步是指控制不同线程的操作发生相对顺序的机制,在共享内存并发模型里,同步是显式进行的,程序员必须显式指定某个方法或某段代码需要在线程之间互斥执行。在消息传递的并发模型里,由于消息的发送必须在消息的接收之…
个人成就
文章被点赞
4
文章被阅读
5,934
掘力值
133
关注了
2
关注者
3
收藏集
0
关注标签
7
加入于
2019-04-12