DeepSeek 这家公司的薪资水平

882 阅读5分钟

DeepSeek

DeepSeek 最近在全球范围的 AI 圈引起了巨大波澜,甚至称为"冲击波"也不为过。

在 DeepSeek 之前,行业普遍认为以 OpenAI 为首的闭源模型要领先开源模型不少,于是整个 AI 大模型(无论开源还是闭源)的技术发展方向,都是按照 OpenAI 那一套来做:堆数据量,堆算力,堆参数规模。

但 DeepSeek-R1 模型的开源,彻底打破了这一局面。

海外研究大模型的人员,从开源仓库中看到关于 DeepSeek-R1 的设计理念和实际表现,彻底懵了。

DeepSeek-R1 首次实现了纯强化学习驱动的推理能力突破,相对策略优化 GRPO(Group Relative Policy Optimization)算法的提出和实现,彻底颠覆了传统的强化学习 RL(Reinforcement Learning)算法。

DeepSeek-R1 仓库

在(某些方向上的)性能表现上,DeepSeek-R1 虽然只比 OpenAI-O1 略胜一筹,但成本却只有 OpenAI-O1 的 5% 不到。

这下美国的政客们彻底坐不住了,他们自以为在 AI 领域上全面领先,而且能够通过限制高端芯片的出口来有限牵制中国 AI 的发展(卡脖子)。但 DeepSeek-R1 的出现,证实了除了"砸算力"以外,还有别的技术方向,可以通向罗马。

海外不少网友把 DeepSeek 的成功,称为"斯普尼特克时刻"。

PS. 斯普尼特克,是苏联在 1957 年成功发射的第一颗人类卫星,标记着美国的太空技术正式被苏联超越,是历史上少数的「在科技领域,美国尝到挫败感的重大事件」之一。

那么如此神奇这一家公司,招聘岗位有哪些,薪资待遇又如何呢?

我从招聘网站上找到了关于 DeepSeek 的招聘信息,供大家参考:

工作地点基本集中在「北京」或「杭州」,招聘岗位涵盖各个方向,「UI、客户端、全栈、算法、架构」都有,薪资普遍都很有竞争力,14 薪。

但相比于 英伟达中国员工的薪资待遇,我觉得还是太保守了,希望 DeepSeek 年底这一波出圈,能给他们研发人员带来一些额外的奖金。

高待遇的背后是高要求,就比如上述截图中「深度学习研究员」的要求中的第 3 点,就要求有顶会论文。

对此,你怎么看?这几天是否有听闻关于 DeepSeek 的消息?是否有上手把玩过?欢迎评论区交流。

...

回归主题。

龙年的最后一天,提前祝大家新年快乐,来一道简单算法题。

题目描述

平台:LeetCode

题号:762

给你两个整数 left 和 right,在闭区间 [left,right][left, right] 范围内,统计并返回计算置位位数为质数的整数个数。

计算置位位数就是二进制表示中 11 的个数。

例如, 2121 的二进制表示 10101 有 33 个计算置位。

示例 1:

输入:left = 6, right = 10

输出:4

解释:
6 -> 110 (2 个计算置位,2 是质数)
7 -> 111 (3 个计算置位,3 是质数)
9 -> 1001 (2 个计算置位,2 是质数)
10-> 1010 (2 个计算置位,2 是质数)
共计 4 个计算置位为质数的数字。

示例 2:

输入:left = 10, right = 15

输出:5

解释:
10 -> 1010 (2 个计算置位, 2 是质数)
11 -> 1011 (3 个计算置位, 3 是质数)
12 -> 1100 (2 个计算置位, 2 是质数)
13 -> 1101 (3 个计算置位, 3 是质数)
14 -> 1110 (3 个计算置位, 3 是质数)
15 -> 1111 (4 个计算置位, 4 不是质数)
共计 5 个计算置位为质数的数字。

提示:

  • 1<=left<=right<=1061 <= left <= right <= 10^6
  • 0<=rightleft<=1040 <= right - left <= 10^4

模拟 + lowbit

利用一个 int 的二进制表示不超过 3232,我们可以先将 3232 以内的质数进行打表。

从前往后处理 [left,right][left, right] 中的每个数 xx,利用 lowbit 操作统计 xx 共有多少位 11,记为 cntcnt,若 cntcnt 为质数,则对答案进行加一操作。

Java 代码:

class Solution {
    static boolean[] hash = new boolean[40];
    static {
        int[] nums = new int[]{2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31};
        for (int x : nums) hash[x] = true;
    }
    public int countPrimeSetBits(int left, int right) {
        int ans = 0;
        for (int i = left; i <= right; i++) {
            int x = i, cnt = 0;
            while (x != 0 && ++cnt >= 0) x -= (x & -x);
            if (hash[cnt]) ans++;
        }
        return ans;
    }
}
  • 时间复杂度:O((rightleft)×logright)O((right - left) \times \log{right})
  • 空间复杂度:O(C)O(C)

模拟 + 分治

枚举 [left,right][left, right] 范围内的数总是不可避免,上述解法的复杂度取决于复杂度为 O(logx)O(\log{x})lowbit 操作。

而比 lowbit 更加优秀的统计「二进制 11 的数量」的做法最早在 191. 位1的个数 讲过,采用「分治」思路对二进制进行成组统计,复杂度为 O(loglogx)O(\log{\log{x}})

Java 代码:

class Solution {
    static boolean[] hash = new boolean[40];
    static {
        int[] nums = new int[]{2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31};
        for (int x : nums) hash[x] = true;
    }
    public int countPrimeSetBits(int left, int right) {
        int ans = 0;
        for (int i = left; i <= right; i++) {
            int x = i;
            x = (x & 0x55555555) + ((x >>> 1)  & 0x55555555);
            x = (x & 0x33333333) + ((x >>> 2)  & 0x33333333);
            x = (x & 0x0f0f0f0f) + ((x >>> 4)  & 0x0f0f0f0f);
            x = (x & 0x00ff00ff) + ((x >>> 8)  & 0x00ff00ff);
            x = (x & 0x0000ffff) + ((x >>> 16) & 0x0000ffff);
            if (hash[x]) ans++;
        }
        return ans;
    }
}
  • 时间复杂度:O((rightleft)×loglogright)O((right - left) \times \log{\log{right}})
  • 空间复杂度:O(C)O(C)