\n\nAnthropic 宣布 OpenAI 联合创始人 Andrej Karpathy 加入其预训练团队,利用 Claude 加速模型研发。此举标志着 OpenAI 核心人才进一步流向 Anthropic,凸显了该公司以研发驱动竞争的战略布局。
译自:Anthropic hires OpenAI co-founder Andrej Karpathy to lead Claude pre-training research
作者:Adrian Bridgwater
Anthropic 今天完成了一项重大招聘。前 Tesla 高级总监、OpenAI 创始成员 Andrej Karpathy 加入了该公司,成为其预训练团队的一员。
Karpathy 本周二在 X(原 Twitter)上发帖称:“个人更新:我已加入 Anthropic。我认为未来几年 LLM 的前沿领域将极具塑造性。我非常激动能加入这里的团队并重返研发岗位。我依然对教育充满热情,并计划适时恢复这方面的工作。”
Karpathy 曾在哪里工作?
在 2016 年完成斯坦福大学博士学位(他详细说明了其研究重点是新型卷积/循环神经网络及其在计算机视觉、自然语言处理及其交叉领域的应用),并曾在 Google DeepMind 团队担任研究实习生后,Karpathy 成为 OpenAI 的首批创始成员,于 2016 年 1 月至 2017 年 6 月担任研究科学家。
离开 OpenAI 后,Karpathy 在 Tesla 担任 AI 高级总监,任职时间超过五年。他在 Musk 的汽车制造和开发公司工作期间,领导了 Tesla Autopilot 的计算机视觉团队。
从这些招聘来看,Anthropic 内部的感受似乎是——考虑到 Karpathy 强大的大规模训练能力——由 AI 加速功能驱动的研发,比单纯的核心算力甚至容量更具竞争差异化优势。
Anthropic 收集 OpenAI 员工
Karpathy 将立即开启新的职业生涯,为 Nicholas Joseph 工作,后者是另一位前 OpenAI 员工,在竞争对手 AI 模型先驱处工作仅九个月后就加入了 Anthropic。
“非常欢迎 Andrej 加入预训练团队!他将组建一支团队,专注于利用 Claude 来加速预训练研究本身。我想不出有谁比他更适合做这件事了——期待我们共同创造的成果!”Joseph 在 X 上写道。
除了 Joseph,Karpathy 还可以与 AI 泰斗 John Schulman 在茶水间谈笑风生,后者同样曾是 OpenAI 创始人团队的一员,其个人博客列出的核心兴趣是机器人和强化学习。
在过去两年中,OpenAI 还流失了其首席科学家 Ilya Sutskever(现为 Safe Superintelligence 首席科学家)以及前 CTO Mira Murati(现为 Thinking Machines Lab 联合创始人兼 CEO)。
为什么 Claude 预训练至关重要
作为 Anthropic 的一个关键重点,Claude 的预训练工作涉及向其基础模型“喂送”各种不同的数据集,涵盖文本、音频、视觉媒体和软件代码,以构建模型模式知识。
“这就像是一家顶级俱乐部招募了一个同时是最佳球员、联盟最佳评论员以及最受关注的青训教练的人。”—— 科技评论员 @signulll。
Claude 的预训练始于一个被称为 Claude 宪法的基础基石。Anthropic 曾描述过这一指令,并表示:“Claude 宪法是对 Anthropic 预期的 Claude 价值观和行为的详细描述。”
匿名科技评论员 @signulll 本周二向其 19.82 万 X 粉丝发布消息,评价 Karpathy 的任命称:“这就像是一家顶级俱乐部招募了一个同时是最佳球员、联盟最佳评论员以及最受关注的青训教练的人。”
创造了“氛围编程”的人
作为过去十年 AI 领域的知名人物,Karpathy 是在去年二月创造了氛围编程(vibe coding)一词的人。
他当时表示:“有一种新的编程方式,我称之为‘氛围编程’。在这种模式下,你完全顺从氛围,拥抱指数级增长,甚至忘记代码的存在。这之所以成为可能,是因为 LLM(例如配备 Sonnet 的 Cursor Composer)正变得太强大了。”
Anthropic 强化安全领导力
本月,随着安全软件工程师 Chris Rohlf 加入该组织的前沿红队,Anthropic 的脑力优势得到了进一步巩固。
“AI 进步的速度令人震惊。我们面前有一个真正的机会,可以利用 AI 大幅改善网络安全。在这个关键时刻,我想不出有比这更好的公司或团队可以加入了。”Rohlf 发布道。
Anthropic 表示,其前沿红队致力于通过压力测试主动防御 AI 模型的网络安全漏洞,这增强了其快速推进 AI 前沿的能力,并确保其是以负责任的方式行事。
基础模型竞赛仍在继续
随着 Anthropic、OpenAI 和 Google 在开发者和终端用户的心目中不断争夺领先地位,这些公司自然会将重大人事变动视为对应实力消长的信号。
从这些招聘来看,Anthropic 内部的感受似乎是——考虑到 Karpathy 强大的大规模训练能力——由 AI 加速功能驱动的研发,比单纯的核心算力甚至容量更具竞争差异化优势。
Karpathy 撰写自己的 Neural Networks: Zero to Hero 博客,并经营自己的 YouTube 频道。全 工智能