首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
Flink
大大大大晴天
创建于2026-02-12
订阅专栏
Flink技术分享
暂无订阅
共24篇文章
创建于2026-02-12
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
Flink技术实践-FlinkSQL视图View避坑指南
视图像一把“逻辑剪刀”——剪得好,代码优雅、复用高效;剪得不好,轻则执行计划失控,重则状态爆炸、作业 OOM。本文将从特性到避坑,帮你全面掌握 Flink SQL 视图的正确打开方式。
Flink技术实践-FlinkSQL窗口技术全解
在实时流处理领域,窗口技术是连接无限数据流与有限计算的桥梁。本文从实战视角出发,系统讲解Flink SQL中窗口技术的核心概念、各类型窗口的适用场景与使用方法,并给出生产环境的最佳实践建议。
Flink技术实践-FlinkSQL Join技术全解
本文将从流处理 Join 的背景挑战出发,系统剖析 Flink SQL 支持的四种核心 Join 方式,通过多维对比给出最佳实践。
Flink技术实践-Flink SQL 开发中的隐蔽陷阱
FlinkSQL以其极低的代码门槛,让复杂的流计算变得像写MySQL一样简单,然而“声明式”表象往往掩盖了“流式”的底层复杂性,本文将聚焦Flink SQL开发层面的隐蔽陷阱,剖析痛点并给出避坑思路。
Flink技术实践-实时流中的脏数据治理
本文从实时流脏数据的核心挑战出发,系统梳理脏数据的多维分类体系,提出“接入即校验、分层过滤、侧输出隔离、可观测闭环”四步治理方案,实现“零脏数据”的目标。
Flink技术实践-90%都会踩的状态坑
Flink状态管理是有状态计算的核心,但80%的线上故障与其相关。本文从状态管理的本质出发,汇总生产环境中最常见的五大坑点,提供可落地的调优方案,并对实时场景下状态管理的演进方向进行展望。
大数据实时计算-反压机制剖析
大数据实时计算中的反压机制是流处理系统应对流量过载的关键保护机制。本文对比分析了三大主流引擎的反压实现:Storm/SparkStreaming/Flink,并对比分析总结。
Flink技术实践-超时异常踩坑与优化
针对Flink实时计算中的超时异常问题,分析了Kafka消费者心跳超时、RPC超时和Checkpoint超时等典型场景的成因。最后根据不同业务场景提出了针对性的参数调优建议,并总结了参数联动配置原则。
Flink-Hudi技术实践:Insert场景开发实践
本文围绕 Flink 写入 Hudi MOR 表的 Insert模式,系统介绍了其技术特性、适用场景以及关键的 Clustering 配置实践,为构建高效稳定的实时数据湖提供了实践指导。
Flink技术实践-实时场景技术方案选型
Flink作为核心引擎,结合Kafka、HBase、Hudi等主流组件,本文梳理出一套覆盖全链路、多场景的实时技术方案选型准则。
Hudi 生产问题排障-Hudi表数据查询字段丢失
本文分析了生产环境中使用Kyuubi-Trino查询Hudi MOR表时出现字段数据缺失的问题,从现象到源码,层层分析定位根因并给出解决方案。
Flink生产问题排障-作业重启异常
在1.14.6的Flink on native k8s模式部署下,以Application方式提交运行的作业遇到cp/sp丢失、无法从最近cp/sp状态启动的问题,介绍排查过程、分析与解决方案
Flink生产问题排障-DAG膨胀导致JobManagerOOM
使用FlinkSQL开发处理宽表CDC数据时采用嵌套CASE WHEN表达式导致SQL解析阶段产生大量语法树节点,引发JobManager堆内存溢出。文章基于问题现象层层排查根因,并给出解决方案与总结
Flink生产问题排障-Hudi DuplicateFileIdException
基于Flink+Hudi的一次Duplicate fileId xxxx异常,引发Hudi 底层组件缺陷,通过层层排查定位根因并解决。
Flink生产问题排障-Hudi UnsupportOperationException
摘要:本文分析了Flink+Hudi实时数据湖建设中因多引擎配置不一致引发的异常问题。此次故障凸显了多引擎环境下配置统一的重要性,建议加强参数管理、测试覆盖和跨引擎协调。
Flink技术实践-作业参数配置最佳实践
本文针对Flink实时计算作业的资源配置与优化提供了配置原则与实践指南,帮助实现Flink作业开发配置最佳实践,提升Flink作业在生产环境的高效稳定运行。
Flink生产问题排障-Failed to deserialize consumer record
基于Canal+Kafka+Flink+Hudi的实时数据入湖链路出现Flink作业频繁重启故障,表现为Kafka偏移量卡住、反序列化异常和checkpoint超时问题,介绍由表及里的根因排查定位过程
Flink-Hudi生产问题排障-xxx.parquet is not a Parquet file
本文分析了Flink+Hudi实时数据湖架构中出现的0字节Parquet文件问题,从问题现象入手,结合FLink+Hudi运行原理,完成问题排查与根因分析,并给出修复方案与总结。
Flink生产问题排障-HBase NotServingRegionException
从表象的 NotServingRegionException 深入到了依赖 Relocation 导致的类加载问题,揭示了Flink在与外部组件交互集成中 “缓存一致性” 与 “依赖管理” 的重要性。
Flink生产问题排障-Kryo serializer scala extensions are not available
Flink任务使用RocksDB状态后端和StateTTL时,因Kryo序列化器在后台Compaction线程中无法获取类加载器导致崩溃。文章从问题现象、原因分析、解决方案等方面讲述Flink生产实战
下一页