首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
二十六画生的博客
掘友等级
大数据研发工程师
|
某头部大厂
技术、旅行、低调
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
47
文章 47
沸点 0
赞
47
返回
|
搜索文章
最新
热门
Kafka 消息队列如何保证顺序性?
主要思路:相同key值的消息写入同一个partition(partition内的消息是有序的),一个partition的消息只会被一个消费者消费。 如果一个消费者是多个线程消费,则需要把pull来的消
Kafka 设置分区副本数 replication.factor
副本数是1 ,意思是就一个分区,同时也是主分区 副本数是2,意思是有2个分区,1个是主分区,1个是从分区 副本数已把主分区数包含在内。 设置replication.factor >= 3。这也是Bro
Mysql表到多大数据量才开始分库分表?垂直切分/水平切分
关系型数据库本身比较容易成为系统瓶颈,单机存储容量、连接数、处理能力都有限。当单表的数据量达到 1000W 或 100G 以后,由于查询维度较多,即使添加从库、优化索引,做很多操作时性能仍下降严重。此
kafka auto.offset.reset / latest / earliest 详解
auto.offset.reset关乎kafka数据的读取,是一个非常重要的设置。常用的二个值是latest和earliest,默认是latest。 latest和earliest区别 1,earli
Flink Event Time / Processing Time / Ingestion Time (事件时间/处理时间/摄取时间)
概念 Flink supports different notions of time in streaming programs. flink支持不同的 time 流媒体的概念。 处理时间: 处理时
HDFS块大小为何是128MB ? block.size
块大小取决于dfs.blocksize,2.x默认为128M,1.x默认为64M(128M指的是块的最大大小!每个块最多存储128M的数据,如果当前块存储的数据不满128M,存了多少数据,就占用多少的
Hive in exists 区别
IN适合于外表大而内表小的情况;EXISTS适合于外表小而内表大的情况。 in /exists / left semi join 不会产生笛卡尔积 ! inner join可能会产生笛卡尔积! 1.
Flink 3种部署模式、保证高可用的区别/Standalone Cluster/Yarn Cluster /Kubernetes Cluster
1 Standalone Cluster Master-Slave架构,JobManager运行在Master节点,TaskManager运行在Slave节点,与HDFS/Hadoop无关 Activ
kafka是如何保证消息不丢失的?生产端/消费端
前提条件 任何消息组件不丢数据都是在特定场景下一定条件的,kafka要保证消息不丢,有两个核心条件。 第一,必须是已提交的消息,即committed message。kafka对于committed
Java random随机数/ seed 种子 / System.nanoTime() 的理解 与 使用
伪随机(preundorandom):通过算法产生的随机数都是伪随机!! 只有通过真实的随机事件产生的随机数才是真随机!!比如,通过机器的硬件噪声产生随机数、通过大气噪声产生随机数 Random生成的
下一页
个人成就
文章被点赞
105
文章被阅读
61,093
掘力值
1,572
关注了
0
关注者
10
收藏集
0
关注标签
2
加入于
2021-06-18