稀土掘金 稀土掘金
    • 首页
    • AI Coding NEW
    • 沸点
    • 课程
    • 直播
    • 活动
    • AI刷题
    • APP
      插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
    • vip
      会员
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
0 /100
海量数据
订阅
avatar
三分恶 创作等级LV.6
更多收藏集

微信扫码分享

微信
新浪微博
QQ

2篇文章 · 0订阅
  • 🌊刷掉 90% 候选人的互联网大厂海量数据面试题(附题解+方法总结)
    1. 如何从大量的 URL 中找出相同的 URL? 给定 a、b 两个文件,各存放 50 亿个 URL,每个 URL 各占 64B,内存限制是 4G。请找出 a、b 两个文件共同的 URL。 每个 URL 占 64B,那么 50 亿个 URL占用的空间大小约为 320GB。 由…
    • yanglbme
    • 5年前
    • 20k
    • 205
    • 24
    算法
    🌊刷掉 90% 候选人的互联网大厂海量数据面试题(附题解+方法总结)
  • 教你如何迅速秒杀掉99%的海量数据处理面试题
    1、海量日志数据,提取出某日访问百度次数最多的那个IP。 2、寻找热门查询,300万个查询字符串中统计最热门的10个查询。 3、上千万或上亿数据(有重复),统计其中出现次数最多的前N个数据。 4、海量数据分布在100台电脑中,想个办法高效统计出这批数据的TOP10。
    • karminski牙医
    • 7年前
    • 20k
    • 107
    • 2
    面试 后端
    教你如何迅速秒杀掉99%的海量数据处理面试题