「【新智元导读】一个从谷歌「打工人」走出的数学怪才,靠着自掏腰包创业,五年把公司做到营收超 12 亿美元,估值 300 亿美金。他讨厌硅谷的浮夸,却意外登上《福布斯 400》富豪榜,成为最年轻的成员。」
一图看透全球大模型!新智元十周年钜献,2025 ASI 前沿趋势报告 37 页首发
纽约,第九大道上奢华的三层星巴克臻选烘焙工坊。
Edwin Chen 点了一杯绿茶,因为他觉得在这里点咖啡太浪费时间。
37 岁的他,刚刚成了美国《福布斯 400》榜单里最年轻的亿万富翁,身价高达 180 亿美元!
但 Edwin Chen 是个怪人——
- 他拒绝 VC 融资,靠着自己在谷歌打工的积蓄打造出一家估值 300 亿美元的 AI 数据标注公司 Surge。
- 他希望让 AI 真正学会「人类的复杂性、人性的丰富性」,他请斯坦福、普林斯顿和哈佛的教授来训练 AI。
- 他持有 Surge 75% 的股份,但依旧每天穿平价的 T 恤、每天坚持步行 2 万步,还是一名素食主义者。
这是一个用自己方式改写 AI 产业规则的人。
「福布斯美国 400 富豪榜」
Forbes 400(福布斯美国 400 富豪榜)是美国_福布斯_杂志(Forbes)每年发布的榜单。
专门列出美国境内最富有的 400 位个人,按其净资产(net worth)从高到低排名。
如果按照年龄排序,37 岁的 Edwin Chen 是新晋的最年轻亿万富翁。
有意思的是,紧随 Edwin Chen 之后的 Lukas Walton 是沃尔玛创始人山姆 · 沃尔顿的孙子,2005 年其父约翰 · 沃尔顿因飞机失事去世后,他继承了大笔遗产,在福布斯 400 榜单上,他的净资产为 398 亿美元。
而如果按照净资产的排序,排名前 15 的最年轻富豪是谷歌的两位创始人,拉里 · 佩奇和谢尔盖 · 布林(52 岁),以及马斯克(54 岁),但没有一个人是 40 岁以下,年龄最大是巴菲特(95 岁)。
福布斯自己都认为,美国最富有的人群也往往是年纪最大的。
过去 25 年间,福布斯 400 富豪榜成员的平均年龄从 61 岁攀升至 70 岁,比 39 岁的美国人平均年龄整整大了三十岁。
在福布斯 400 最新的榜单中,Edwin Chen 甚至还没有头像(目前)。
「低调到「无人认识」的 AI 亿万富翁」
Edwin Chen 此前如此低调,以至于即使 Scale AI 的 Alexander Wang 被 Meta 重金收购时,他的名字也没有「浮现」在媒体中。
但随着 Scale AI 引发的对数据标注的关注度,Edwin Chen 如今这位福布斯 400 富豪榜最年轻的成员,正准备走出幕后发出自己的声音。
福布斯的记者 Phoebe Liu 对 Edwin Chen 进行了一次专访,揭开了这家另类数据标注公司 Surge 背后的故事。
「福布斯 400 最年轻成员」
Edwin Chen 曾在谷歌、脸书和推特(现在的 X)任职,在 AI 革命的浪潮中悄然创立了数据标注公司 Surge。
Phoebe Liu 在纽约的星巴克对 Edwin Chen 进行了两个多小时的专访,以下是访谈全文,略作删改。
在曼哈顿公寓里用整个上午审阅数据集、研读论文并调试尖端 AI 模型后,Edwin Chen 信步走向第九大道上的星巴克臻选烘焙工坊。
身着 Vuori 藏青色 T 恤,肩挎虎纹帆布托特包,Edwin Chen 走下楼梯坐在暗角卡座。
这位数据标注与 AI 训练公司 Surge AI 的创始人兼 CEO 啜饮着小杯绿茶。
Edwin Chen 聊天时连珠妙语:
从硅谷文化(他深恶痛绝)到竞争对手(全是人力外包作坊);再到若外星人造访地球时的人类交互方式,「他们不说英语,该如何沟通?如何破译其语言?或许能通过某种数学方式实现。」
这一困境也在他最喜欢的短篇小说——科幻作家特德 · 姜 1998 年的作品《你一生的故事》中有所探讨。
该小说后来成为电影《降临》的蓝本,讲述了一位语言学家通过识别外星人语言和文字中的模式与之交流的故事。
Edwin Chen 表示,这也是他在 2020 年创立 Surge 的部分灵感来源,他希望自己的数据标注公司能够编码「人性的丰富性」。
对他而言,这意味着让最聪明的人类(包括斯坦福、普林斯顿和哈佛的教授)来训练 AI,将他们的专业知识转化为支撑大语言模型的 0 和 1 代码。
除了这些常春藤联盟的精英,Edwin Chen 还雇佣了来自全球 50 多个国家的超过百万名零工工作者,他们负责提出可能难倒 AI 的问题,评估模型的回答,并编写帮助 AI 生成完美回复的标准。
Edwin Chen 说,「我真心认为我们所做的工作对所有 AI 模型都至关重要,没有我们,通用 AI(AGI)就不可能实现」。
「从未听说过的最成功的科技企业家」
Edwin Chen,一位言辞冗长、才华横溢且性格古怪的人物,或许是你从未听说过的最成功的科技企业家。
这主要是因为他一直刻意保持低调。
即使是 Surge AI 的官网也是同样的低调,低调到主页只有一堆文字,没有酷炫的 UI 和精致的互动效果。
这位曾在推特、谷歌和脸书任职的数据科学家避开了传统的风险投资,七年前离开了硅谷这个「鱼缸」,选择用自己在大科技公司十年积累的「几百万」存款来资助 Surge 公司。
「我们自筹资金的原因之一是我一直讨厌硅谷的地位游戏,」Edwin Chen 说道,他将典型的由风投支持的硅谷初创公司描述为「快速致富的计划」。
他也讨厌筹集大量资金然后不得不花掉的想法。
在他看来,这会导致大规模的超额招聘。
Surge 仅有 250 名员工,包括全职、兼职和顾问。相比之下,其竞争对手 Scale AI 的员工数量是 Surge 的四倍,但收入却更少。
Surge 自成立不到五年间,2024 年营收已达 12 亿美元,客户涵盖谷歌、Meta、微软以及 AI 实验室 Anthropic 和 Mistral。
Edwin Chen 透露,公司几乎从创立首日就实现盈利!
基于当前业绩,其估值约达 240 亿美元。
Surge 正以 300 亿美元估值进行 10 亿美元融资谈判,目前该轮融资尚未最终落定。
Edwin Chen 决定使用「自有资金」支持 Surge 的决策获得了丰厚回报:他持有的约 75% 股份估值约 180 亿美元,这足以使他成为今年福布斯美国 400 富豪榜上最富有的新晋成员。
年仅 37 岁的他,也是该榜单上最年轻的成员。
「独特的数据标注模式」
Surge 声称其方法不同于旧式的数据标注模式——后者往往雇佣全球欠发达国家的人员,以每小时几美分的报酬让他们坐在电脑前区分猫和狗。
相反,Edwin Chen 的数据标注员(包括专业人士和教授)会遵循一套指令与在线聊天机器人互动。
他们可能被要求尝试诱导聊天机器人输出错误或有毒回复,然后撰写更好的回应;或者被要求比较不同 AI 对同一问题的回复,并解释为何某一回复更优。
按收入计算,Surge 目前是该行业最大的企业!
但包括 Scale AI(Meta 于 6 月以 140 亿美元收购其 49% 股份)、Turing、Mercor 和 Invisible AI 在内的竞争对手正在迅速崛起。
一直以来,Edwin Chen 都在幕后默默建设他的公司并积累声誉。
一位现任 Meta 研究员表示,Surge 只是不愿透露他们的任何工作细节。
但随着行业的发展,Edwin Chen 不再满足于置身幕后。
他深切担忧当今的 AI 模型被错误的目标所优化,将用户引入幻觉兔子洞——这正如他曾在 YouTube 和 Twitter 工作时,那些平台的算法主要被优化来追求点击率。
他希望 Surge 能帮助引领 AI 行业的发展,这意味着他要将自己定位为更具影响力的思想领袖。
「数学怪才」
Edwin Chen 在佛罗里达州的水晶河(人口 3400 人)长大,这座墨西哥湾沿岸城市以海牛和退休人士而非科技亿万富翁闻名。
他的父母从台湾移民到美国,经营着一家中泰美式餐厅,Edwin Chen 少年时期曾在那里工作。
他真正的兴趣在于语言与数学之间的关联。
用他自己的话说:我一直对语言的数学基础很着迷。
小时候,他想学习大约 20 种语言,并且热爱拼字比赛。
数学对他来说很容易,但直到他开始注意到数字中独特的模式,数学才真正抓住他的想象力。
Edwin Chen 在八年级就学习了微积分,他表示自己获得了精英寄宿学校乔特中学(位于康涅狄格州)最后两年全额奖学金,该校校友包括约翰 · 肯尼迪和伊万卡 · 特朗普。
在修完乔特所有数学课程后,他高三大部分时间都在耶鲁大学教授指导下研究任何自己感兴趣的课题。
随后他进入麻省理工学院,主修数学,共同创立了语言学社团,并实行多相睡眠计划——即将睡眠分割成多次短时休息,比如每六小时小睡 30 分钟,而非连续八小时的长眠。
在麻省理工学院就读三年后,Edwin Chen 在彼得 · 蒂尔位于旧金山的对冲基金实习,并对此非常喜欢,以至于再也没有返校。
完成必修课程后,他申请了学位并于两年后获得。
随后,他先后在推特、谷歌和脸书工作,担任过涉及内容审核和推荐算法的多个职位。
在每一个职位上,Edwin Chen 都遇到了同样的问题:难以大规模获取高质量的人工标注数据。
2020 年,他离开推特,并于同年创立了 Surge。
「不想上市的创业者」
Edwin Chen 是一名素食主义者,他每天步行两万步,并称在纽约街头漫步时能迸发出最佳思考。
每周一两次,他会午夜漫步至时代广场。
「我热爱看到这浓缩的人间百态——百老汇演员、来自世界各地的游客、夜班工人、艺术家——被灯光、科技与基础设施环绕。」
「为什么有人会想上市呢?上市公司的一大问题在于它们总是不得不为短期利益而担忧。」
Edwin Chen 厌倦了那些「完全是垃圾」的数据标注,这些标注要么来自报酬过低而不在乎的人,要么来自缺乏必要文化或政治知识以做出明智判断的人。
Surge 希望雇佣那些理解语境并对语言有深刻理解的人。
他在业务的其他方面也采取了独特策略。
放弃传统的销售与营销手段,他最初通过自己广受欢迎的数据科学博客进行沟通——这个博客是他在十多年前业余时间创建的。
他表示,Surge 的首批客户正是通过该博客获得,但拒绝透露具体名单。
已知早期客户包括爱彼迎、Twitch 及其前雇主推特公司。
他尝试直接向科技公司的数据科学家进行推广,认为这些人能识别 Surge 数据质量并更愿意付费(据两名研究人员透露,Surge 的收费比竞争对手高出 50% 至十倍)。
2023 年 5 月的一个周六夜晚,一位谷歌研究员经同事推荐致电 Edwin Chen。
当时谷歌的 Gemini 系列 AI 模型状况相当糟糕。
这通电话持续了两个多小时。
不久后,谷歌与 Surge 签订了年额超 1 亿美元的合同。
AI 初创公司往往守口如瓶,但即便在同业中,Surge 仍显得格外神秘。
其最大客户也不完全清楚其数据优势所在。
反过来,Surge 及其竞争对手也难以追踪哪些数据最终用于训练 Gemini、Claude 或 OpenAI 的 GPT 模型。
Surge 拒绝透露其项目人员匹配机制、数据收集方式及标注流程。
客户支付数百万美元后,获得的仅是一个数据集链接。
这使得 Surge 能够通过隐藏测试、由评分更高的标注员进行人工审核,以及优化表现且可能相当对抗性的机器学习算法,更密切地监控标注员的表现。
Edwin Chen 坚持认为,Surge 的质量控制和深厚的技术专长是其秘密武器。
「AI 不再依赖人类进行数据标注的那天」
对于 Surge 这类企业而言,存在一个根本性问题:随着 AI 技术的进步,是否会有一天不再需要人类进行数据标注?
据 Meta 研究人员透露,今年四月发布的 Llama4 等模型已大量依赖 AI 自主生成和标注数据——即所谓的合成数据。
Surge 采用了一种人机协同的变通方案:由 AI 生成数据并自行标注,但由人类评估其表现。
Edwin Chen 坚信人类不可或缺。
他指出当人类与 AI 协同工作时,所能达到的成就远超任何单方的独立成果。
但即便人类保持参与,若行业更注重机器自我训练,仍将影响其盈利空间——因为训练成本将大幅降低。
参考资料: