首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
海量数据
订阅
三分恶
更多收藏集
微信扫码分享
微信
新浪微博
QQ
2篇文章 · 0订阅
🌊刷掉 90% 候选人的互联网大厂海量数据面试题(附题解+方法总结)
1. 如何从大量的 URL 中找出相同的 URL? 给定 a、b 两个文件,各存放 50 亿个 URL,每个 URL 各占 64B,内存限制是 4G。请找出 a、b 两个文件共同的 URL。 每个 URL 占 64B,那么 50 亿个 URL占用的空间大小约为 320GB。 由…
教你如何迅速秒杀掉99%的海量数据处理面试题
1、海量日志数据,提取出某日访问百度次数最多的那个IP。 2、寻找热门查询,300万个查询字符串中统计最热门的10个查询。 3、上千万或上亿数据(有重复),统计其中出现次数最多的前N个数据。 4、海量数据分布在100台电脑中,想个办法高效统计出这批数据的TOP10。