大数据数仓问题 - 欣xy的收藏集 - 掘金

大数据数仓问题

更多收藏集

3篇文章 · 0订阅

一种基于布隆过滤器的大表计算优化方法

问题背景当前业内流行的优化方案 1.增加集群资源 2.采用增量计算问题场景和 Spark 算法分析大表问题思考使用布隆过滤器的优化方案 Spark 函数 Java 代码实现使用示例演示实测

政采云技术
3年前
3.4k
16
1

一种基于布隆过滤器的大表计算优化方法

本文主要介绍Kafka基本知识，包含Topic、Partition、消费者、生产者、副本等基本概念，同时也介绍了Kafka版本变迁以及应用实战所必备的知识点，最后以“消息可靠性分析“结尾，加深理解。

字节跳动技术团队
3年前
49k
481
23

你需要的不是实时数仓 | 你需要的是一款强大的OLAP数据库(下)

在上一章节中，我们讲到实时数仓的建设，互联网大数据技术发展到今天，各个领域基本已经成熟，有各式各样的解决方案可以供我们选择。在实时数仓建设中，解决方案成熟，消息队列Kafka、Redis、Hbase鲜

王知无
6年前
8.8k
18
评论