稀土掘金 稀土掘金
    • 首页
    • AI Coding NEW
    • 沸点
    • 课程
    • 直播
    • 活动
    • AI刷题
    • APP
      插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
    • vip
      会员
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
0 /100
大数据数仓问题
订阅
avatar
欣xy 创作等级LV.4
更多收藏集

微信扫码分享

微信
新浪微博
QQ

3篇文章 · 0订阅
  • 一种基于布隆过滤器的大表计算优化方法
    问题背景 当前业内流行的优化方案 1.增加集群资源 2.采用增量计算 问题场景和 Spark 算法分析 大表问题思考 使用布隆过滤器的优化方案 Spark 函数 Java 代码实现 使用示例演示 实测
    • 政采云技术
    • 2年前
    • 3.3k
    • 16
    • 1
    后端 算法
    一种基于布隆过滤器的大表计算优化方法
  • Kafka 科普
    本文主要介绍Kafka基本知识,包含Topic、Partition、消费者、生产者、副本等基本概念,同时也介绍了Kafka版本变迁以及应用实战所必备的知识点,最后以“消息可靠性分析“结尾,加深理解。
    • 字节跳动技术团队
    • 3年前
    • 46k
    • 460
    • 23
    Kafka
  • 你需要的不是实时数仓 | 你需要的是一款强大的OLAP数据库(下)
    在上一章节中,我们讲到实时数仓的建设,互联网大数据技术发展到今天,各个领域基本已经成熟,有各式各样的解决方案可以供我们选择。在实时数仓建设中,解决方案成熟,消息队列Kafka、Redis、Hbase鲜
    • 王知无
    • 6年前
    • 8.5k
    • 18
    • 评论