首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
大数据数仓问题
订阅
欣xy
更多收藏集
微信扫码分享
微信
新浪微博
QQ
3篇文章 · 0订阅
一种基于布隆过滤器的大表计算优化方法
问题背景 当前业内流行的优化方案 1.增加集群资源 2.采用增量计算 问题场景和 Spark 算法分析 大表问题思考 使用布隆过滤器的优化方案 Spark 函数 Java 代码实现 使用示例演示 实测
Kafka 科普
本文主要介绍Kafka基本知识,包含Topic、Partition、消费者、生产者、副本等基本概念,同时也介绍了Kafka版本变迁以及应用实战所必备的知识点,最后以“消息可靠性分析“结尾,加深理解。
你需要的不是实时数仓 | 你需要的是一款强大的OLAP数据库(下)
在上一章节中,我们讲到实时数仓的建设,互联网大数据技术发展到今天,各个领域基本已经成熟,有各式各样的解决方案可以供我们选择。在实时数仓建设中,解决方案成熟,消息队列Kafka、Redis、Hbase鲜