后端 - 掘金

大数据-160 Apache Kylin Cube 实战：从建模到构建与查询（含踩坑与优化）

Apache Kylin（3.x/4.x）Cube 的搭建与优化：从 DataSource → Model → Cube 的完整流程，覆盖维度建模、度量设计、Cuboid 预计算、Aggregatio

武子康
9
点赞

大数据-160 Apache Kylin Cube 实战：从建模到构建与查询（含踩坑与优化）

大数据-158 Apache Kylin 3.1.1 在 Hadoop 2.9/Hive 2.3/HBase 1.3 的最小可用部署实录（含坑位与修复）

Hadoop 2.9.2、Hive 2.3.9、HBase 1.3.1、Spark 2.4.5、Apache Kylin 3.1.1 与三节点 ZooKeeper/YARN。

武子康
23
1

大数据-158 Apache Kylin 3.1.1 在 Hadoop 2.9/Hive 2.3/HBase 1.3 的最小可用部署实录（含坑位与修复）

大数据-156 Apache Druid+Kafka 实时分析实战：JSON 拉平摄取与 SQL 指标全流程

Scala Kafka Producer 将订单/点击数据写入 Kafka Topic（示例 topic: druid2），在 Druid 中通过 Kafka Indexing Service

武子康
45
3

大数据-156 Apache Druid+Kafka 实时分析实战：JSON 拉平摄取与 SQL 指标全流程

大数据-159 Apache Kylin Cube 实战：Hive 装载与预计算加速（含 Cuboid/实时 OLAP，Kylin 4.x）

OLAP 示例：用 Python 生成维度与事实数据，经 Hive（wzk_kylin）装载后，在 Kylin 侧设计 Cube（维度/度量/Cuboid），并给出分组聚合 SQL 的验证结果。

武子康
28
点赞

大数据-159 Apache Kylin Cube 实战：Hive 装载与预计算加速（含 Cuboid/实时 OLAP，Kylin 4.x）

大数据-155 Apache Druid 存储与查询架构实战：Segment/Chunk/Roll-up/Bitmap 一文讲清

Apache Druid 的数据存储与高性能查询路径：从 DataSource/Chunk/Segment 的分层，到列式存储、Roll-up 预聚合、Bitmap 索引、mmap 文件映射、查询

武子康
36
2

大数据-155 Apache Druid 存储与查询架构实战：Segment/Chunk/Roll-up/Bitmap 一文讲清

Flink 的 RocksDB 状态后端在 vivo 的实践

本文简要介绍了特征拼接在实时推荐中的重要作用，并讲述了vivo实时推荐系统中特征拼接模块的架构演进过程以及采用现有的“基于RocksDB的大状态解决方案”的原因，并给出了这些问题的现象以及解决方案。

大数据-157 Apache Kylin 全面指南：MOLAP 架构、Hive/Kafka 实战与实时 OLAP 落地

Apache Kylin 的背景、演进与工程实践，聚焦 MOLAP 方案在海量数据分析中的落地路径。核心关键词：Apache Kylin、MOLAP、Cube、Cuboid、Hive、Kafka

武子康
48
2

大数据-157 Apache Kylin 全面指南：MOLAP 架构、Hive/Kafka 实战与实时 OLAP 落地

大数据-152 Apache Druid 集群模式 [下篇] 低内存集群实操：JVM/DirectMemory与启动脚本

三台节点上落地 Apache Druid 30.0.0 的低内存集群实践：给出 Broker/Historical/Router 的 JVM 参数（-Xms/-Xmx 与 -XX:MaxDirectM

武子康
38
2

大数据-152 Apache Druid 集群模式 [下篇] 低内存集群实操：JVM/DirectMemory与启动脚本

大数据-151 Apache Druid 集群落地 [上篇] MySQL 元数据 + HDFS 深存与低配调优

Apache Druid 30.0.0 的可落地方案，覆盖 MySQL 元数据存储（mysql-connector-java 8.0.19）、HDFS 深度存储与 HDFS 上的 indexing

武子康
30
2

大数据-151 Apache Druid 集群落地 [上篇] MySQL 元数据 + HDFS 深存与低配调优

从 OpenSearch 到 Apache Doris：领创集团日志系统升级实践，降本 45%

领创集团技术团队启动了日志系统的架构升级实践，选择 Apache Doris 作为新一代日志系统的核心。实现了综合成本下降超 45%、查询性能提升 5 倍、日志写入达到准实时以及灵活的运维策略等收益

SelectDB
72
点赞

从 OpenSearch 到 Apache Doris：领创集团日志系统升级实践，降本 45%

大数据-149 Apache Druid 实时 OLAP 架构与选型要点

Apache Druid 的实时 OLAP 实战：适合以时间为主键的事件明细、亚秒级聚合与高并发自助分析。Druid 采用列式存储与时间分区，核心组件包括 Broker、Historical、Midd

武子康
48
1

大数据-149 Apache Druid 实时 OLAP 架构与选型要点

货拉拉用户画像基于 Apache Doris 的数据模型设计与实践

导读用户画像与实时数据分析是互联网企业的数据核心。货拉拉作为覆盖全球多地区的同城货运平台，基于 Apache Doris 构建了高效的人群计算系统，支撑用户画像的批

货拉拉用户画像基于 Apache Doris 的数据模型设计与实践

大数据-147 Java 访问 Apache Kudu：从建表到 CRUD（含 KuduSession 刷新模式与多 Master 配置）

Java 客户端（kudu-client 1.4.0）连接 Apache Kudu 多 Master（示例端口 7051/7151/7251），完成建表、插入、查询、更新、删除全流程

武子康
54
2

大数据-147 Java 访问 Apache Kudu：从建表到 CRUD（含 KuduSession 刷新模式与多 Master 配置）

大数据-148 Flink 写入 Kudu 实战：自定义 Sink 全流程（Flink 1.11/Kudu 1.17/Java 11）

Kudu 的完整可运行示例，基于 Flink 1.11.1（Scala 2.12）/Java 11 与 kudu-client 1.17.0（2025 实测）。通过 RichSinkFunction

武子康
54
1

大数据-148 Flink 写入 Kudu 实战：自定义 Sink 全流程（Flink 1.11/Kudu 1.17/Java 11）

Flink SQL在实时数仓中的应用

随着大数据时代的到来，企业对数据处理的实时性要求越来越高。传统的批处理模式已经无法满足现代业务的需求，实时数据仓库（Real-time Data Warehouse）应运而生。Apache Flink

Homi
64
2

Flink SQL在实时数仓中的应用

Flink Table API与SQL的最佳实践

在实时数据处理领域，Apache Flink凭借其低延迟、高吞吐的流处理能力成为行业标杆。而Flink的Table API与SQL作为统一的声明式接口，极大简化了流批一体应用的开发。它们让开发者无需深

Homi
59
3

Flink Table API与SQL的最佳实践

大数据-153 Apache Druid 实时接入 Kafka：从摄取到查询的完整实战

「Kafka→Apache Druid」的实时摄取实战：以网络流量 JSON 为例，通过 Druid 控制台的 Streaming/Kafka 向导完成接入、解析时间列（ts→__time）、设定维度

武子康
27
3

大数据-153 Apache Druid 实时接入 Kafka：从摄取到查询的完整实战

大数据-143 ClickHouse 实战MergeTree 分区/TTL、物化视图、ALTER 与 system.parts 全流程示例

ClickHouse 初学与运维实战，基于真实集群（h121/h122/h123）演示从连接到建库建表的完整流程，系统讲解 MergeTree 的 ORDER BY/PRIMARY KEY/PARTI

武子康
65
1

大数据-143 ClickHouse 实战MergeTree 分区/TTL、物化视图、ALTER 与 system.parts 全流程示例

大数据-144 Apache Kudu：实时写 + OLAP 的架构、性能与集成

Apache Kudu 在 2025 年的版本与生态集成：最新 Kudu 1.18.0（2025/07）上线，带来分段 LRU Block Cache 与基于 RocksDB 的元数据存储（实验特性）

武子康
59
1

大数据-144 Apache Kudu：实时写 + OLAP 的架构、性能与集成

你想了解的在这里 - 豆包MarsCode 青训营 - 寒假专场 Q&A

欢迎你加入青训营大家庭！或许“字节跳动青训营”这几个字是第一次出现在你的眼前，你的小小脑袋还充满着大大的疑惑🤔❓ 青训营的课程有哪些？如何才能参加？别担心！请收下这篇为你量身定做的青训营官方答疑