首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
用户3367373763940
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
2
文章 2
沸点 0
赞
2
返回
|
搜索文章
最新
热门
avro文件存储格式
avro是一种二进制数据编码格式,将一个类对象或者在说一种格式的数据转化二进制编码,可以将其写为文件,也可以存在于内存中,我们分析一下它在内存中的存储格式。 如图,在文件中存储时首先分为 header
iceberg delete写入
v2写入逻辑在BaseDeltaTaskWriter中 这里的write其实就是BaseTaskWriter中BaseEqualityDeltaWriter类的子类RowDataDeltaWriter
iceberg parquet类型EQdelete文件具体写入流程
首先在 build() 方法中通过IcebergStreamWriter<RowData> streamWriter = createStreamWriter(table, flinkRowType,
flink MapState状态
使用flink状态需要先创建状态的类型描述,flink中的类型信息都使用TypeInformation进行描述,flink使用自定义的类型主要是为了对其存储做一些优化,比如对java类中变量存储的字节
iceberg的记录删除功能的核心类Deletes解析
首先Deletes类有4个静态内部类 其中EqualitySetDeleteFilter,PositionSetDeleteFilter,DataFileFilter都继承自Filter抽象类,其中需
flink读取iceberg核心流程
读取流程一般都是通过planTasks方法返回CombinedScanTask,然后根据CombinedScanTask生成RowDataIterator迭代器访问数据 RowDataIterator
iceberg flink-source读取流程
flink读取iceberg代码 首先调用创建一个Builder 然后进行一些设置,在调用build()进行构建 buildFormat()构建一些基本信息,如iceberg表,io,schema等信
iceberg过期删除
过期删除代码 直接创建一个RemoveSnapshots,然后设置过期条件,然后直接进入到RemoveSnapshots的commit方法中 在internalApply()中对过期snapshot进
iceberg flink写入提交流程
提交流程在IcebergFilesCommitter的snapshotState中 dataFilesPerCheckpoint.put(checkpointId, writeToManifest(c
iceberg元数据
以下为一个hive-catalog的iceberg表的所有存在hdfs目录中的文件 包含 1.parquet数据文件 2.json元数据文件 3.avro snapshot文件 4.avro mani
下一页
个人成就
文章被点赞
3
文章被阅读
16,262
掘力值
328
关注了
3
关注者
4
收藏集
1
关注标签
7
加入于
2021-03-22