首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
大数据
订阅
胃疼
更多收藏集
微信扫码分享
微信
新浪微博
QQ
22篇文章 · 0订阅
浅谈Flink分布式运行时和数据流图的并行化
本文将以WordCount的案例为主线,主要介绍Flink的设计和运行原理。关于Flink WordCount程序可以参考我之前的文章:读取Kafka实时数据流,实现Flink WordCount。阅读完本文后,读者可以对Flink的分布式运行时有一个全面的认识。 在大数据领域…
Flink 并行度(Parallel)
TaskManager 和 Slot 每个 TaskManager 中都会有一到多个 solt。 solt 的数量通常与每个 TaskManager 节点的可用 CPU 内核数成比例。一般情况下你的
2021年大数据Flink(四十三):扩展阅读 关于并行度
一个Flink程序由多个Operator组成(source、transformation和 sink)。1.2.执行环境(任务)的默认并行度可以通过调用setParallelism()方法指定。3.并行度可以在客户端将job提交到Flink时设定。./bin/flink run ...
沙龙回顾|ClickHouse 在字节广告 DMP& CDP 的应用
众所周知,广告是很多互联网公司的主要收入,对于字节跳动来说也是如此。那么,在字节跳动广告的 DMP&CDP 业务,乃至所有广告业务中,有哪些场景在使用 ClickHouse 呢?是在线服务还是离线统计的呢?应该说都有。 可以从三个场景来讲:人群预估、人群画像和统计分析…
数仓建模分层理论
从字面上来看,数据仓库就是一个存放数据的仓库,它里面存放了各种各样的数据,而这些数据需要按照一些结构、规则来组织和存放。
Flink 从0-1实现 电商实时数仓 - 分层介绍 & 新建计算项目
分层介绍 需求分析及实现思路 在之前介绍实时数仓概念时讨论过,建设实时数仓的目的,主要是增加数据计算的复用性。每次新增加统计需求时,不至于从原始数据进行计算,而是从半成品继续加工而成。
基于 Flink 实现解决数据库分库分表任务拆分
例如订单库进行了分库分表,其示例如下图所示: 现在的需求是希望创建一个任务就将数据同步到MQ集群,而不是为每一个数据库实例单独创建一个任务,将其数据导入到MQ集群,因为同步任务除了库不同之外,表的结构、数据映射规则都是一致的。2.温馨提示:有关 Stream API 的详细内容将...
实时计算框架:Flink集群搭建与运行机制
Flink是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。Flink被设计在所有常见的集群环境中运行,以内存执行速度和任意规模来执行计算。
如何基于 BitMap 进行海量的数据分析
本文抽取 GrowingIO 在事件分析中的通用数据模型,揭晓该功能背后的存储模型和实现原理。 在用户行为的数据分析中,无论是无埋点,还是埋点,对于某一条行为数据的表达形式往往是:「某人」于「某个时间」在「某个维度」下做了「某个动作」「多少次」。 所以在数据统计中,这种表达形式…
Flink学习笔记(二)——进入Flink
用idea新建一个maven项目,取名随便,创建好自己的包,在包下面新建一个java文件,并同时在maven中引入Flink的依赖,这样就可以直接开始编程了,这里引入的是最近版本哦。 接下来是主题程序,创建设置运行环境及配置,监听客户端。 PS:在flink 1.11之前的版本…