首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
Daniel_Qu
掘友等级
大数据开发
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
Custom Kafka Connect Transform
Kafka Connect常用于各种Kafka于外界的数据传输。Transform是connect中的组件,可以用来转换数据类型,增减字段等。
Flink On Yarn
单个yarnsession模式在yarn集群中,我们提交了一个yarnsession任务,给这个session分配了一定大小的资源,这个session相当于是一个application,它是一个常驻任
Kafka Producer内存池设计
Kafka为了提高吞吐量,Producer采用批量发送数据的模式。Producer可以通过配置设置整个batch缓冲区的大小以及每一个batch的大小: 当消息达到把batch大小,就会在buffer中申请一定大小的空间,封装成一个新的batch。然后Producer就会以ba…
KakfaProducer读写分离案例CopyOnWriteMap
记录Kafka producer中读写分离设计的CopyOnWriteMap。 读写分离的设计使得使用这个数据类型的时候,写数据时需要耗费更多的内存空间,但是在读取数据的时候不需要加锁,读取效率非常的高效。 Kafka Producer可以批量发送数据,每一个批次是一个batc…
Kafka分区策略
Kafka为我们提供了默认的分区策略和自定义消息分区策略两种方式管理producer端消息分区。 Kafka默认分区使用的是DefaultPartitioner,它实现了Partitioner接口。 首先我们看一下Partitioner接口。 很显然,partition方法就是…
Java Application内存泄露
为了让程序员能更加专注代码本身,Java通过后台GC自动管理内存垃圾。通常情况下,GC程序可以解决大部分内存回收的问题,但是如果代码写的不规范就会存在内存泄露的问题。 Java GC程序通过引用计数和根节点可达性来标记某个内存空间是否需要回收。 引用计数法就是某个对象被引用一次…
Spark分区策略
Spark数据是可以分区分散在集群各个机器中的,并且Spark会根据key使用Partitioner类进行数据分区。Spark提供两个分区类:HashPartitioner/RangePartitio
个人成就
文章被点赞
3
文章被阅读
23,816
掘力值
534
关注了
0
关注者
2
收藏集
0
关注标签
60
加入于
2020-08-03