首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
flink
订阅
李白字太白
更多收藏集
微信扫码分享
微信
新浪微博
QQ
22篇文章 · 0订阅
大数据Hadoop之——Apache Hudi 数据湖实战操作(FlinkCDC)
Hudi(Hadoop Upserts Deletes and Incrementals),简称Hudi,是一个流式数据湖平台,关于Hudi的更多介绍可以参考我以下几篇文章:
火山引擎 Iceberg 数据湖的应用与实践
在云原生计算时代,云存储使得海量数据能以低成本进行存储,但是这也给如何访问、管理和使用这些云上的数据提出了挑战。而 Iceberg 作为一种云原生的表格式,可以很好地应对这些挑战。
面试官:“同学,你做的这几个项目都不错。但怎么问QPS你就胡说呢?”
这位同学,你比上一位面试者好多了,你的简历中做的几个项目都不错。既有业务项目,也有技术项目,看得出你对编程开发是有一定的经验积累的。
手把手带你玩转 iceberg - Flink Datastream写Iceberg表
本文将在此前搭建的数据湖系统上使用Flink分布式引擎来实时读取Kafka中的数据并入湖,我们会使用trino命令行sql来查看入湖的数据。flink任务使用搭建的flinkOperator进行提交。
手把手带你玩转 iceberg - Flink Sql 读写Iceberg表
本篇我们在一台ECS服务器上安装Flink SQL Client, 然后尝试在数据湖中建表以及添加数据。
Flink+ 数据湖 Iceberg 的体验
现在业界对数据胡Flink+Iceberg的关注度相对高,而且还能看到一些公司在生产环境上的使用。通过对这个技术的相关调研,本文对比了这个技术点相比于Hive和Kafka的一些优点。
Flink RocksDB 状态后端参数调优实践
截至当前,Flink 作业的状态后端仍然只有 Memory、FileSystem 和 RocksDB 三种可选,且 RocksDB 是状态数据量较大(GB 到 TB 级别)时的唯一选择。RocksDB 的性能发挥非常仰赖调优,如果全部采用默认配置,读写性能有可能会很差。 但是,…
Flink作业问题分析和调优实践
简单地说就是 Flink 为了达到容错和 exactly-once 语义的功能,定期把 state 持久化下来,而这一持久化的过程就叫做 checkpoint ,它是 Flink Job 在某一时刻全局状态的快照。 当我们要对分布式系统实现一个全局状态保留的功能时,传统方案会引…
JRC Flink流作业调优指南
Apache Flink 作为 Google Dataflow Model 的工业级实现,经过多年的发展,如今已经成为流式计算开源领域的事实标准。
美团点评基于 Flink 的实时数仓建设实践
近些年,企业对数据服务实时化服务的需求日益增多。本文整理了常见实时数据组件的性能特点和适用场景,介绍了美团如何通过 Flink 引擎构建实时数据仓库,从而提供高效、稳健的实时数据服务。此前我们美团技术博客发布过一篇文章《流计算框架 Flink 与 Storm 的性能对比》,对 …