首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
关注
综合
后端
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
排行榜
综合
后端
排行榜
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
全部
后端
Java
Python
面试
数据库
前端
架构
Go
Spring Boot
展开
全部
后端
Java
Python
面试
数据库
前端
架构
Go
Spring Boot
MySQL
大数据
Linux
Elasticsearch
.NET
程序员
暂无数据
推荐
最新
大数据-160 Apache Kylin Cube 实战:从建模到构建与查询(含踩坑与优化)
Apache Kylin(3.x/4.x)Cube 的搭建与优化:从 DataSource → Model → Cube 的完整流程,覆盖维度建模、度量设计、Cuboid 预计算、Aggregatio
大数据-158 Apache Kylin 3.1.1 在 Hadoop 2.9/Hive 2.3/HBase 1.3 的最小可用部署实录(含坑位与修复)
Hadoop 2.9.2、Hive 2.3.9、HBase 1.3.1、Spark 2.4.5、Apache Kylin 3.1.1 与三节点 ZooKeeper/YARN。
大数据-156 Apache Druid+Kafka 实时分析实战:JSON 拉平摄取与 SQL 指标全流程
Scala Kafka Producer 将订单/点击数据写入 Kafka Topic(示例 topic: druid2),在 Druid 中通过 Kafka Indexing Service
大数据-159 Apache Kylin Cube 实战:Hive 装载与预计算加速(含 Cuboid/实时 OLAP,Kylin 4.x)
OLAP 示例:用 Python 生成维度与事实数据,经 Hive(wzk_kylin)装载后,在 Kylin 侧设计 Cube(维度/度量/Cuboid),并给出分组聚合 SQL 的验证结果。
大数据-155 Apache Druid 存储与查询架构实战:Segment/Chunk/Roll-up/Bitmap 一文讲清
Apache Druid 的数据存储与高性能查询路径:从 DataSource/Chunk/Segment 的分层,到 列式存储、Roll-up 预聚合、Bitmap 索引、mmap 文件映射、查询
Flink 的 RocksDB 状态后端在 vivo 的实践
本文简要介绍了特征拼接在实时推荐中的重要作用,并讲述了vivo实时推荐系统中特征拼接模块的架构演进过程以及采用现有的“基于RocksDB的大状态解决方案”的原因,并给出了这些问题的现象以及解决方案。
大数据-157 Apache Kylin 全面指南:MOLAP 架构、Hive/Kafka 实战与实时 OLAP 落地
Apache Kylin 的背景、演进与工程实践,聚焦 MOLAP 方案在海量数据分析中的落地路径。核心关键词:Apache Kylin、MOLAP、Cube、Cuboid、Hive、Kafka
大数据-152 Apache Druid 集群模式 [下篇] 低内存集群实操:JVM/DirectMemory与启动脚本
三台节点上落地 Apache Druid 30.0.0 的低内存集群实践:给出 Broker/Historical/Router 的 JVM 参数(-Xms/-Xmx 与 -XX:MaxDirectM
大数据-151 Apache Druid 集群落地 [上篇] MySQL 元数据 + HDFS 深存与低配调优
Apache Druid 30.0.0 的可落地方案,覆盖 MySQL 元数据存储(mysql-connector-java 8.0.19)、HDFS 深度存储与 HDFS 上的 indexing
从 OpenSearch 到 Apache Doris:领创集团日志系统升级实践,降本 45%
领创集团技术团队启动了日志系统的架构升级实践,选择 Apache Doris 作为新一代日志系统的核心。实现了综合成本下降超 45%、查询性能提升 5 倍、日志写入达到准实时以及灵活的运维策略等收益
大数据-149 Apache Druid 实时 OLAP 架构与选型要点
Apache Druid 的实时 OLAP 实战:适合以时间为主键的事件明细、亚秒级聚合与高并发自助分析。Druid 采用列式存储与时间分区,核心组件包括 Broker、Historical、Midd
货拉拉用户画像基于 Apache Doris 的数据模型设计与实践
导读 用户画像与实时数据分析是互联网企业的数据核心。货拉拉作为覆盖全球多地区的同城货运平台,基于 Apache Doris 构建了高效的人群计算系统,支撑用户画像的批
大数据-147 Java 访问 Apache Kudu:从建表到 CRUD(含 KuduSession 刷新模式与多 Master 配置)
Java 客户端(kudu-client 1.4.0)连接 Apache Kudu 多 Master(示例端口 7051/7151/7251),完成 建表、插入、查询、更新、删除 全流程
大数据-148 Flink 写入 Kudu 实战:自定义 Sink 全流程(Flink 1.11/Kudu 1.17/Java 11)
Kudu 的完整可运行示例,基于 Flink 1.11.1(Scala 2.12)/Java 11 与 kudu-client 1.17.0(2025 实测)。通过 RichSinkFunction
Flink SQL在实时数仓中的应用
随着大数据时代的到来,企业对数据处理的实时性要求越来越高。传统的批处理模式已经无法满足现代业务的需求,实时数据仓库(Real-time Data Warehouse)应运而生。Apache Flink
Flink Table API与SQL的最佳实践
在实时数据处理领域,Apache Flink凭借其低延迟、高吞吐的流处理能力成为行业标杆。而Flink的Table API与SQL作为统一的声明式接口,极大简化了流批一体应用的开发。它们让开发者无需深
大数据-153 Apache Druid 实时接入 Kafka:从摄取到查询的完整实战
「Kafka→Apache Druid」的实时摄取实战:以网络流量 JSON 为例,通过 Druid 控制台的 Streaming/Kafka 向导完成接入、解析时间列(ts→__time)、设定维度
大数据-143 ClickHouse 实战MergeTree 分区/TTL、物化视图、ALTER 与 system.parts 全流程示例
ClickHouse 初学与运维实战,基于真实集群(h121/h122/h123)演示从连接到建库建表的完整流程,系统讲解 MergeTree 的 ORDER BY/PRIMARY KEY/PARTI
大数据-144 Apache Kudu:实时写 + OLAP 的架构、性能与集成
Apache Kudu 在 2025 年的版本与生态集成:最新 Kudu 1.18.0(2025/07)上线,带来分段 LRU Block Cache 与基于 RocksDB 的元数据存储(实验特性)
你想了解的在这里 - 豆包MarsCode 青训营 - 寒假专场 Q&A
欢迎你加入青训营大家庭! 或许“字节跳动青训营”这几个字是第一次出现在你的眼前,你的小小脑袋还充满着大大的疑惑🤔❓ 青训营的课程有哪些?如何才能参加? 别担心!请收下这篇为你量身定做的青训营官方答疑