首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
大大大大晴天
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
25
文章 25
沸点 0
赞
25
返回
|
搜索文章
大大大大晴天
10小时前
关注
Flink技术实践-FlinkSQL Join技术全解
本文将从流处理 Join 的背景挑战出发,系统剖析 Flink SQL 支持的四种核心 Join 方式,通过多维对比给出最佳实践。...
0
评论
分享
大大大大晴天
2天前
关注
Flink技术实践-Flink SQL 开发中的隐蔽陷阱
FlinkSQL以其极低的代码门槛,让复杂的流计算变得像写MySQL一样简单,然而“声明式”表象往往掩盖了“流式”的底层复杂性,本文将聚焦Flink SQL开发层面的隐蔽陷...
0
评论
分享
大大大大晴天
4天前
关注
大数据分布式处理基石:分布式理论深度解析
本文将从CAP定理与BASE理论出发,探讨分布式系统设计的根本约束,继而深入分布式事务的核心协议(2PC、3PC),最后剖析分布式一致性算法的演进,旨在帮助读者夯实大数据分...
1
评论
分享
大大大大晴天
5天前
关注
Flink技术实践-实时流中的脏数据治理
本文从实时流脏数据的核心挑战出发,系统梳理脏数据的多维分类体系,提出“接入即校验、分层过滤、侧输出隔离、可观测闭环”四步治理方案,实现“零脏数据”的目标。...
1
评论
分享
大大大大晴天
8天前
关注
Flink技术实践-90%都会踩的状态坑
Flink状态管理是有状态计算的核心,但80%的线上故障与其相关。本文从状态管理的本质出发,汇总生产环境中最常见的五大坑点,提供可落地的调优方案,并对实时场景下状态管理的演...
1
评论
分享
大大大大晴天
9天前
关注
Hudi 生产问题排障-乱序Upsert入湖数据丢失
对Flink实时写入Hudi表时出现的数据丢失问题,排查发现根源在于Hudi对乱序数据的处理缺陷,凸显了深入理解Hudi合并机制及严格测试乱序场景的重要性。...
1
评论
分享
大大大大晴天
14天前
关注
Flink-Hudi技术实践:Upsert场景开发实践
本文深入解析Hudi-Upsert模式在Flink实时场景下的应用实践,通过对比Upsert与Insert模式的特点,为不同业务场景提供技术选型参考,助力构建高效实时数据湖...
1
评论
分享
大大大大晴天
16天前
关注
大数据实时计算-反压机制剖析
大数据实时计算中的反压机制是流处理系统应对流量过载的关键保护机制。本文对比分析了三大主流引擎的反压实现:Storm/SparkStreaming/Flink,并对比分析总结...
1
评论
分享
大大大大晴天
18天前
关注
Flink技术实践-超时异常踩坑与优化
针对Flink实时计算中的超时异常问题,分析了Kafka消费者心跳超时、RPC超时和Checkpoint超时等典型场景的成因。最后根据不同业务场景提出了针对性的参数调优建议...
1
评论
分享
大大大大晴天
20天前
关注
Flink-Hudi技术实践:Insert场景开发实践
本文围绕 Flink 写入 Hudi MOR 表的 Insert模式,系统介绍了其技术特性、适用场景以及关键的 Clustering 配置实践,为构建高效稳定的实时数据湖提...
1
评论
分享
大大大大晴天
23天前
关注
Flink技术实践-实时场景技术方案选型
Flink作为核心引擎,结合Kafka、HBase、Hudi等主流组件,本文梳理出一套覆盖全链路、多场景的实时技术方案选型准则。...
1
评论
分享
大大大大晴天
27天前
关注
Hudi 生产问题排障-Hudi表数据查询字段丢失
本文分析了生产环境中使用Kyuubi-Trino查询Hudi MOR表时出现字段数据缺失的问题,从现象到源码,层层分析定位根因并给出解决方案。...
1
评论
分享
大大大大晴天
29天前
关注
实时数仓架构演进与展望:从Lambda到湖仓一体的剖析
随着数字化转型进入深水区,企业对数据实时性的需求从 “加分项” 升级为 “必需品”,实时数仓作为核心基础设施,经历了从流批分离的Lambda架构,到全流处理的Kappa架构...
1
评论
分享
大大大大晴天
1月前
关注
Hudi生产问题排障-insert overwrite 路径不存在
Yarn资源抢占导致Executor启动延迟超过Hudi版本保留周期,Driver持有的过期元数据引发Task读取失败,最终导致Hive结果表的路径文件不存在。文章从问题出...
1
评论
分享
大大大大晴天
1月前
关注
Flink生产问题排障-DAG膨胀导致JobManagerOOM
使用FlinkSQL开发处理宽表CDC数据时采用嵌套CASE WHEN表达式导致SQL解析阶段产生大量语法树节点,引发JobManager堆内存溢出。文章基于问题现象层层排...
1
评论
分享
大大大大晴天
1月前
关注
Flink生产问题排障-Hudi DuplicateFileIdException
基于Flink+Hudi的一次Duplicate fileId xxxx异常,引发Hudi 底层组件缺陷,通过层层排查定位根因并解决。...
1
评论
分享
大大大大晴天
1月前
关注
Flink生产问题排障-Hudi UnsupportOperationException
摘要:本文分析了Flink+Hudi实时数据湖建设中因多引擎配置不一致引发的异常问题。此次故障凸显了多引擎环境下配置统一的重要性,建议加强参数管理、测试覆盖和跨引擎协调。...
1
评论
分享
大大大大晴天
1月前
关注
Flink技术实践-作业参数配置最佳实践
本文针对Flink实时计算作业的资源配置与优化提供了配置原则与实践指南,帮助实现Flink作业开发配置最佳实践,提升Flink作业在生产环境的高效稳定运行。...
1
评论
分享
大大大大晴天
1月前
关注
Flink生产问题排障-Failed to deserialize consumer record
基于Canal+Kafka+Flink+Hudi的实时数据入湖链路出现Flink作业频繁重启故障,表现为Kafka偏移量卡住、反序列化异常和checkpoint超时问题,介...
1
评论
分享
大大大大晴天
1月前
关注
Flink-Hudi生产问题排障-xxx.parquet is not a Parquet file
本文分析了Flink+Hudi实时数据湖架构中出现的0字节Parquet文件问题,从问题现象入手,结合FLink+Hudi运行原理,完成问题排查与根因分析,并给出修复方案与...
1
评论
分享
下一页
个人成就
文章被点赞
25
文章被阅读
1,085
掘力值
452
关注了
0
关注者
3
收藏集
2
关注标签
17
加入于
2024-03-20