面试 - cheeseleng的收藏集 - 掘金

面试

更多收藏集

29篇文章 · 0订阅

如何给 100 亿个数字排序?

今天要给 100 亿个数字排序，100 亿个 int 型数字放在文件里面大概有 37.2GB，非常大，内存一次装不下了。那么肯定是要拆分成小的文件一个一个来处理，最终在合并成一个排好序的大文件。

androidwing
9年前
3.4k
116
2

如何给 100 亿个数字排序?

数据结构-堆和堆排序

堆是二叉树。不是对象内存的堆。不同的概念。本质是一个数据结构，二叉树。有一些特点的二叉树。基于数组实现。正因为父节点比子节点大，基于这个，根节点始终是最大的节点。父节点，比子节点要大。但是又不是有序二叉树。就是只有队头才是最大的，权重最高，在最上面。每次弹出数据，就是…

relax
6年前
1.1k
点赞
评论

🌊刷掉 90% 候选人的互联网大厂海量数据面试题（附题解+方法总结）

1. 如何从大量的 URL 中找出相同的 URL？给定 a、b 两个文件，各存放 50 亿个 URL，每个 URL 各占 64B，内存限制是 4G。请找出 a、b 两个文件共同的 URL。每个 URL 占 64B，那么 50 亿个 URL占用的空间大小约为 320GB。由…

yanglbme
6年前
20k
206
24

🌊刷掉 90% 候选人的互联网大厂海量数据面试题（附题解+方法总结）

大数据必备10道海量数据处题目，你会几道？

点击上方 "云祁QI"关注, “星标”一起成长十道海量数据处理面试题 1、海量日志数据，提取出某日访问百度次数最多的那个IP。此题，在我之前的一篇文章算法里头有所提到，当时给出的方案是：IP的数目

云祁
5年前
1.1k
6
1

写在19年初的后端社招面试经历(两年经验): 蚂蚁头条 PingCAP

去年（18年）年底想出来看看机会，最后很幸运地拿到了 PingCAP，今日头条的 offer 以及蚂蚁金服的口头 offer。想着可以总结一下经验，分享一下自己这一段"骑驴找马"过的心路历程。当然，一家之言，难免粗浅，如有不妥，敬请指正。全文有点长，假如只对一家公司感兴趣的话…

布客飞龙
7年前
18k
266
31

聊聊 Kafka： Kafka 为啥这么快？

一、前言我们都知道 Kafka 是基于磁盘进行存储的，但 Kafka 官方又称其具有高性能、高吞吐、低延时的特点，其吞吐量动辄几十上百万。小伙伴们是不是有点困惑了，一般认为在磁盘上读写数据是会降低性

老周聊架构
4年前
2.3k
9
评论

面试官：能聊聊Paxos算法和ZAB协议吗

是一种基于消息传递的，具有高容错的一致性算法。主要解决分布式系统中，如何就某个决策达成一致性的问题。主要的工程实现，ZAB，Google Chubby、微信的 PhxPaxos。 paxos算法的作者认为，在信道不可信的前提下，通过消息传递的方式达成一致性，是不可能的。因此，…

ggsd_ddu
6年前
5.9k
1
1

漫话：如何给女朋友解释什么是Linux的五种IO模型？

周日午后，刚刚放下手里的电话，正在给刚刚的面试者写评价。刚刚写到『对Linux的基本IO模型理解不深』这句的时候，女朋友突然出现。在Java中，主要有三种IO模型，分别是阻塞IO（BIO）、非阻塞IO（NIO）和异步IO（AIO）。 Java中提供的IO有关的API，在文件…

漫话编程
7年前
15k
342
28

RabbitMQ面试题（总结最全面的面试题）

MQ就是消息队列。是软件和软件进行通信的中间件产品异步处理 - 相比于传统的串行、并行方式，提高了系统吞吐量。应用解耦 - 系统间通过消息通信，不用关心其他系统的处理。流量削锋 - 可以通过消息队列长度控制请求量；可以缓解短时间内的高并发请求。日志处理 - 解决大量日志…

小杰要吃蛋
6年前
53k
120
9

面试总结 | Linux后台开发不得不看的知识点(给进军bat的你！)

100G的文本，每行80k还是80字符，提示用多个机器，多进程，多线程，求出重复最多的行。一个机器内存8G，计算每个机器大概分多少？能读取100G的文本吗？找重复率前十的文本三个有序的序列，查找公共的部分，第一次我说用哈希表，他说序列太大，空间复杂度要低点，我说了二分查找，他…

我是程序员小贱
6年前
4.5k
7
1