首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
木讷DATA
掘友等级
DataDevelop
围绕DATA转圈圈
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
1
文章 1
沸点 0
赞
1
返回
|
搜索文章
最新
热门
02.flink实时数据管理-cdc捕获ETL作业进度 + join广播变量
数据管理第二步,flink实时监控作业运行情况;本文描述内容:flink-cdc监控execution_jobs表,实时获取作业,并join广播变量,转化projectName。
01.Hive调优篇-典型数据倾斜
Hive数据不均匀或者写法不注意,都会出现数据倾斜,将任务运行时间拉长,严重将会导致作业运行失败;常见大小表关联,数据分布不均导致;
01.Flink实时数据管理—自定义MysqlSource + 广播变量创建
Flink链接Azkaban元数据库:获取projects工程码表,并作为广播变量,供后续监控ETL作业运行情况时,关联提取工程名称;
01.数仓常见概念术语
数仓中指标-标签、维度-度量、自然键-代理键的文章,对于数仓中的各种概念又有新的理解和认识。本文主要从三组概念来进行对比说明;
个人成就
文章被点赞
1
文章被阅读
2,251
掘力值
72
关注了
0
关注者
0
收藏集
0
关注标签
0
加入于
2021-10-24