谷歌大神 Jeff Dean 万字访谈:大一统时代已来,未来人人标配 50 个“AI 实习生”

0 阅读7分钟

在硅谷,流传着这样一句话:“Jeff Dean 的简历,就是一部现代 AI 的发展史。”

作为谷歌首席人工智能科学家、Gemini 的核心缔造者,Jeff Dean 极少接受深度专访。近日,在一场长达 46 分钟的对谈中,这位亲手重写过谷歌搜索全栈、缔造了 TPU 硬件神话的传奇工程师,罕见地抛出了大量关于 AI 演进的犀利预判。

从“蒸馏技术”的底牌,到“万亿 Token”的野心;从“大一统模型”对垂直专家的降维打击,到未来职场“一人指挥 50 个虚拟实习生”的科幻场景。这场对话不仅是谷歌 AI 战略的底牌大揭秘,更是一份写给所有开发者的“未来生存指南”。

一、 速度即正义:为什么谷歌死磕 Flash 小模型与能耗?

在各大实验室拼命卷模型上限、争夺跑分王座时,谷歌却把极大的精力放在了 Gemini Flash 这种“高能效比”的小模型上。很多人不解,这是否意味着谷歌在向算力妥协?

Jeff Dean 给出的答案非常现实:前沿模型是为了探索能力的边界,而小模型是为了霸占真实世界的场景。

他透露,将庞大的前沿模型(如 Ultra、Pro)通过“蒸馏(Distillation)”技术压缩成轻量级的 Flash 模型,是谷歌的核心策略。通过蒸馏,小模型能够学到大模型处理逻辑的“暗知识”,从而在低成本、低延迟的前提下,达到甚至超越上一代大模型的水平。

更有意思的是,他从一个极其底层的工程师视角,解释了为什么“延迟和能耗”才是 AI 现阶段最大的瓶颈。他指出,计算本身(如乘法运算)极其便宜(不到 1 pJ),但把数据从内存搬运到计算单元的代价极其高昂(高达 1000 pJ)。“如果你花 1000 的力气搬数据,只做 1 的计算,那是极大的浪费。” 这就是为什么加速器必须用批处理(Batching),也是为什么极低精度(如三值精度)将成为未来的大杀器。

【笔者观点:不要被“跑分”骗了,低延迟才是杀手锏】 Jeff Dean 揭示了一个被很多人忽视的商业真相:在真实业务中,“快”比“聪明”更重要。 当 AI 的响应速度从 100 Token/秒提升到 1000 甚至 10000 Token/秒时,人机交互的范式将彻底改变。就像自动驾驶,你不需要车脑子里装满莎士比亚,你只需要它在 0.1 秒内决定刹车。谷歌疯狂推广 Flash 模型,甚至将其塞进搜索、Gmail 和 YouTube,本质上是在用“极低延迟+白菜价成本”对竞争对手进行生态降维打击。

二、 大一统模型的降维打击:垂直领域的“专家”要失业了?

过去几年,AI 界流行一种思路:通用模型搞不定专业问题,我们需要专门训练“医疗大模型”、“法律大模型”或者“奥数大模型”。

但 Jeff Dean 毫不客气地宣告:大一统模型的时代真的来了。

他以解决国际奥数难题为例,过去人们试图把神经系统和符号系统结合,搞各种专用工具;但现在,谷歌直接把所有的任务都塞进了统一的 Gemini 模型里,靠着更强的推理资源,纯语言模型就能解出数学竞赛题。“通用模型在绝大多数情况下,都会胜过专用模型。”

那么,垂直领域模型还有存在的意义吗?Jeff 的答案是:有,但它的形态变了。未来的 AI 就像现在的操作系统,核心是一个极其强大的通用基座(装满了世界常识),然后配合各种“可安装的模块”。当你需要看病时,你就像下载软件包一样,给基座模型挂载一个“医疗模块”,这个模块是被顶级医院的私有数据“喂”出来的。

【笔者观点:“套壳微调”创业的死刑判决书】 这对目前市面上大量做“行业垂直大模型”的创业公司来说,是个极其危险的信号。 靠拿几本行业白皮书、用开源基座微调一下就敢自称“XX 领域第一大模型”的时代彻底结束了。因为通用模型(基座)的进化速度太快,它会毫不留情地碾压这些浅层的垂直护城河。未来真正的垂直壁垒,只存在于那些掌握着“极其稀缺且无法公开获取的私有数据”(如顶级三甲医院的脱敏病历)的机构手中。

三、 跨越百万上下文:“把整个互联网塞进 AI 脑子里”

当目前的大模型还在为 100 万或 200 万上下文窗口欢呼时,Jeff Dean 的目光已经盯上了“万亿 Token”。

怎么做到?答案并不是简单粗暴地扩大神经网络的注意力机制(这在计算上是不可能的),而是借鉴了谷歌做搜索引擎的看家本领——分层检索。

系统会先用极低的成本,从海量信息中捞出 3 万个相关片段,再用更强的模型浓缩到 117 个,最后用最顶级的模型进行深度推理。这样一来,在用户体验上,模型就仿佛拥有了“处理万亿 Token”的神力。

这不仅适用于文本,更适用于视频、音频甚至激光雷达数据。Jeff Dean 坚信,视觉和动态时序(视频)是绝对的核心模态。当一个模型能够直接“看懂”你过去 20 年的所有邮件、照片和行车记录仪视频时,它将从一个“聪明的百科全书”,变成一个“全知全能的个人分身”。

【笔者观点:从“搜索引擎”到“答案引擎”的终极进化】 谷歌在长上下文和多模态上的执念,其实是在保卫自己的搜索帝国。 过去的搜索,是给你一堆蓝色链接让你自己找;未来的搜索,是 AI 瞬间翻完整个互联网和你的个人私有云,然后直接把那个你想要的“最终答案”递到你手里。谁能最快、最准、最便宜地完成这种“漏斗式”的信息提纯,谁就能拿到下一个十年的互联网入口门票。

四、 程序员的未来:从写代码,到管理“50 个数字实习生”

作为计算机历史上最高产的工程师之一,Jeff Dean 自己是怎么用 AI 写代码的?

他坦言,现在的代码智能体已经非常强大。未来的工作形态将发生剧变:每个工程师不再是单打独斗,而是化身为团队主管,手下带着 50 个“虚拟实习生”。

你不需要再自己去敲打每一行基础代码,你的核心技能变成了“极其清晰、无歧义地定义需求”。如果你没说清楚边界条件或性能要求,AI 就会乱写一通。因此,写一手高质量的提示词(Prompt)和内部系统架构备忘录,将成为未来程序员最重要的核心竞争力。

更有意思的是,当 AI 的生成速度突破 10000 Token/秒时,人类甚至不再需要去“阅读”它生成的代码了。AI 可以在后台疯狂地自我验证、自我推演 9000 行,最后只给你输出 1000 行绝对正确的完美代码。

【总结陈词:超级个体的崛起与平庸的消亡】 Jeff Dean 描绘的这幅图景既让人热血沸腾,又让人脊背发凉。 如果一个人能指挥 50 个 AI 实习生,那意味着什么?意味着传统的“人海战术”彻底破产,意味着初级程序员、外包工种将面临毁灭性的打击。 但同时,这也意味着“超级个体”的时代正式降临。只要你拥有顶尖的系统架构思维和极其敏锐的业务直觉,你一个人,就能活成一家上市公司。面对 AI 浪潮,焦虑毫无意义,学会如何当好这 50 个 AI 实习生的“带教大哥”,才是我


👇 欢迎关注我的公众号

在 AI 爆发的深水区,我们一起探索真正能穿越周期的技术价值。 微信搜索 【睿见新世界】 或扫描下方二维码,获取每周硬核技术推文:

欢迎关注【睿见新世界】!