首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
武子康
掘友等级
后端工程师
永远好奇 无限进步!
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
148
文章 146
沸点 2
赞
148
返回
|
搜索文章
武子康
后端工程师
·
6小时前
关注
大数据-141 ClickHouse 副本实战 | ReplicatedMergeTree + ZooKeeper 从 0–1:创建、选举、日志复制、排障
ClickHouse 副本全链路:ZK/Keeper 准备、macros 宏配置、集群 ON CLUSTER 一致建表、写入去重与复制机制、system.* 视图健康检查、...
1
评论
分享
武子康
后端工程师
·
1天前
关注
大数据-140 ClickHouse CollapsingMergeTree详解 外部数据源最小闭环HDFS/MySQL/Kafka
ClickHouse 外部数据源引擎的最小可行方案:ENGINE=HDFS、ENGINE=MySQL、ENGINE=Kafka 的 DDL 模板、关键参数与读写链路。示范 ...
1
评论
分享
武子康
后端工程师
·
1天前
关注
大数据-139 ClickHouse MergeTree 最佳实践:Replacing 去重、Summing 求和、分区设计与物化视图替代方案
ClickHouse 两大轻聚合引擎 ReplacingMergeTree 与 SummingMergeTree,结合最小可运行示例(MRE)与对照查询,解释为何去重/求和...
2
评论
分享
武子康
后端工程师
·
3天前
关注
大数据-138 ClickHouse MergeTree 实战详解|分区裁剪 × 稀疏主键索引 × marks 标记 × 压缩
ClickHouse MergeTree 的存储与查询路径:列式文件(*.bin)、稀疏主键索引(primary.idx)、标记文件(.mrk/.mrk2)与 index_...
1
评论
分享
武子康
后端工程师
·
4天前
关注
大数据-137 ClickHouse MergeTree 实战指南|分区、稀疏索引与合并机制 存储结构 一级索引 跳数索引
ClickHouse MergeTree 的关键机制:批量写入形成 part、后台合并(Compact/Wide 两种 part 形态)、ORDER BY 即稀疏主索引、i...
1
评论
分享
武子康
后端工程师
·
5天前
关注
AI研究-113 DeepSeek-OCR 原理与架构全解|视觉压缩长文本 SAM-base 16×下采样 CLIP-L 3B-MoE
系统拆解 DeepSeek-OCR 的“上下文光学压缩”思路:将长文本渲染为图片,以视觉 token 取代海量文本 token,显著降低长上下文成本。按数据流解析架构:SA...
1
评论
分享
武子康
后端工程师
·
5天前
关注
大数据-136 - ClickHouse 集群 表引擎详解 选型实战:TinyLog/Log/StripeLog/Memory/Merge
梳理 ClickHouse 表引擎:TinyLog、Log、StripeLog、Memory、Merge 的原理、适用与坑点,并给出可复制的最小可运行示例(MRE)...
1
评论
分享
武子康
后端工程师
·
6天前
关注
大数据-135 ClickHouse 集群连通性自检 + 数据类型避坑实战|10 分钟跑通 ON CLUSTER
先完成集群连通性自检:system.clusters 校验 → ON CLUSTER 创建 ReplicatedMergeTree/Distributed,然后研究Clic...
1
评论
分享
武子康
后端工程师
·
7天前
关注
DeepSeek-OCR 原理剖析|上下文光学压缩、Gundam 动态分辨率与并发预期 附代码
拆解 DeepSeek-OCR 的视觉→文本压缩:Tiny/Small/Base/Large 的视觉 token 规模、Gundam 的局部+全局策略,以及 Transfo...
1
评论
分享
武子康
后端工程师
·
8天前
关注
大数据-134 ClickHouse 单机+集群节点落地手册 | 安装配置 | systemd 管理 / config.d
官方推荐的 keyring + signed-by 在 Ubuntu 安装 ClickHouse,并用 systemd 启动与自检;提供单机与集群多节点的最小示例。...
2
评论
分享
武子康
后端工程师
·
9天前
关注
大数据-133 ClickHouse 概念与基础|为什么快?列式 + 向量化 + MergeTree 对比
面向“高并发、低延迟 OLAP”场景,本文从工程视角讲清 ClickHouse 的底层优势(列式+压缩+向量化、MergeTree 家族)、适用与不适用边界(OLAP vs...
1
评论
分享
武子康
后端工程师
·
10天前
关注
大数据-132 Flink SQL 实战入门 | 3 分钟跑通 Table API + SQL 含 toChangelogStream 新写法
工程视角快速跑通 Flink SQL:提供现代依赖(不再使用 blink 规划器)、最小可运行示例(MRE)、Table API 与 SQL 互操作;输出使用 toChan...
3
评论
分享
武子康
后端工程师
·
11天前
关注
大数据-131 Flink CEP 实战 24 小时≥5 次交易 & 10 分钟未支付检测 案例附代码
Flink CEP(Complex Event Processing)复杂事件处理机制,结合实际案例深入讲解其在实时流式计算中的应用原理与实战实现。通过定义事件模式(Pat...
1
评论
分享
武子康
后端工程师
·
12天前
关注
大数据-130 - Flink CEP 详解 - 捕获超时事件提取全解析:从原理到完整实战代码教程 恶意登录案例实现
Flink CEP 超时事件提取是流处理中的关键环节,用于在模式匹配过程中捕获超过窗口时间(within)的部分匹配事件。通过 select()、flatSelect() ...
2
评论
分享
武子康
后端工程师
·
13天前
关注
大数据-129 - Flink CEP详解:实时流式复杂事件处理(Complex Event Processing)全解析
Flink中专用于复杂事件流实时分析的核心组件,提供完整的模式匹配框架,支持基于事件时间(Event Time)的乱序处理与高性能NFA(非确定性有限自动机)匹配机制。...
1
评论
分享
武子康
后端工程师
·
14天前
关注
大数据-128 - Flink 并行度详解:从概念到最佳实践,一文读懂任务并行执行机制 代码示例与性能优化
Flink 中,并行度(Parallelism)是衡量任务并发处理能力的核心参数,决定了每个算子(Operator)可以同时运行的任务数量。合理设置并行度能显著提升作业的吞...
1
评论
分享
武子康
后端工程师
·
15天前
关注
大数据-127 - Flink StateBackend详解:Memory、Fs、RocksDB 与 OperatorState 管理机制与重分配原理
Flink ManagedOperatorState用于管理无键(non-keyed)状态,实现算子在故障恢复或扩缩容时的状态一致性。开发者可通过实现Checkpointe...
1
评论
分享
武子康
后端工程师
·
16天前
关注
大数据-126 - Flink一文搞懂有状态计算:State Backend 工作原理与性能差异详解 核心原理与作用
状态存储(State Backend)是其实现有状态流计算的核心机制,决定了数据的可靠性、性能与容错性。Flink 提供三种内置存储后端:MemoryStateBacken...
2
评论
分享
武子康
后端工程师
·
17天前
关注
大数据-125 - Flink 实时流计算中的动态逻辑更新:广播状态(Broadcast State)全解析
广播状态(Broadcast State)是 Apache Flink 中支持流式应用动态更新逻辑的重要机制,广泛应用于实时风控、用户行为分析、动态规则评估等场景。它允许低...
1
评论
分享
武子康
后端工程师
·
18天前
关注
大数据-124 - Flink State:Keyed State、Operator State KeyGroups 工作原理 案例解析
根据是否依赖中间状态,Flink 计算可分为有状态和无状态两种类型:无状态计算(Stateless Computation)如 Map、Filter、FlatMap 等操作...
2
评论
分享
下一页
个人成就
文章被点赞
195
文章被阅读
11,949
掘力值
3,542
关注了
1
关注者
47
收藏集
0
关注标签
10
加入于
2019-11-11