为什么我们AI追得这么快?这位大佬说出了事实

0 阅读9分钟

查看更多精彩

艾伦研究所AI大牛36小时中国行,彻底颠覆对中国AI的认知。

大家好呀,感谢大家一直以来的关注和支持!🌹

今天咱们来聊一个近期刷屏AI圈的热门话题👇

这位海外AI大牛,仅用36小时完成中国闪电考察,回国后写下长文,字字句句都刷新了外界对中国AI的固有印象。

最近一篇海外深度观察文章火速出圈:www.interconnects.ai/p/notes-fro… (原文)

文章作者是内森·兰伯特,艾伦研究所资深研究员,更是开源AI圈极具话语权的行业大佬。

图片

他素来以犀利客观著称,极少主动夸赞同行,这一次来华全程为个人行程,无任何官方背景加持,只为亲自探底中国AI的真实实力。

谁也没想到,这场短暂的36小时之旅,直接推翻了他过往对中国AI的所有认知。

36小时暴走6大顶级AI机构,行程卷到同行叹服。

你们敢想象这紧凑的行程密度吗?

内森下飞机后便直奔阿里北京园区,随后马不停蹄开启连轴模式:

智谱AI、月之暗面、清华大学、美团、小米、零一万物

(原文还出现笔误写成“灵异万物”,属实有点可爱😂)

国内六大AI顶流机构,他全部走访打卡。

平均每家交流时长不足6小时,期间和数十位一线研究员、工程师、青年学子深度畅谈。

这样的工作强度,不光外国从业者惊叹,就连国内资深科技记者都直呼:真的卷不过。

走访结束后,一向眼光挑剔的内森一改往日态度,坦言道:我从前自认很了解中国AI,如今才发现,我连皮毛都未曾触及。中国AI的发展逻辑,根本无法用西方的思维去定义。

和美的AI的核心差距,从来不是资金与芯片。

这篇长文最引发热议的观点,直击行业本质:中国AI能够实现飞速追赶,靠的从来不是砸钱、堆算力、拼数据,独有的研发文化才是核心底气。

这番话,让整个硅谷陷入了沉默。

先看看美AI圈的研发现状,妥妥的大型内耗现场。

大模型研发是系统性工程,数据、架构、训练、RLHF各环节环环相扣,为了整体性能优化,必然要取舍部分个人创意。

但美国研究员大多个人主义极强,人人都想彰显自身能力。

为了争夺论文一作、争抢项目话语权,常常僵持到项目停滞。内森也亲自吐槽,Llama团队便是因内部斗争元气大伤。

甚至有实验室需要额外花费成本安抚研究员,只因个人想法未被采纳便闹情绪离职。

简言之:美AI圈,人人都想做主角,内耗不断,最终拖慢整体发展节奏。

反观中国AI圈,妥妥的开挂成长模式,彻底颠覆了内森的认知。

01 青年学子挑大梁,甘愿深耕基础工作。

在美国OpenAI、Anthropic等头部企业,实习生几乎接触不到核心研发,日常仅能做基础杂活。

但在中国,大批大模型研发的核心贡献者,都是尚未毕业的硕博研究生。

他们并非单纯实习镀金,而是实打实参与核心研发工作。

数据清洗、样本标注、参数调优这些海外从业者眼中“不酷”的脏活累活,中国年轻人始终踏实深耕。

比起发表顶会论文、争抢署名位次,他们更在意模型性能的迭代升级,甘愿熬夜攻坚。

同时新一代从业者没有行业历史包袱,不受过往技术思路束缚。

从MoE架构到RLHF训练,再到AI智能体,新技术风口出现便能快速上手,毫无路径依赖。

02 极致工程师思维,聚焦落地解决问题。

内森曾做过一个有趣的调研,向国内研究员提问:你认为AI长远发展会带来哪些社会风险?

大部分人的第一反应都是短暂愣神。

并非无法作答,而是大家的想法高度统一:做好模型、打磨技术是本职工作,相关衍生风险自有专业团队考量。

这种一心务实干事的工程师思维,和西方先耗费数年探讨风险,才肯动手落地的律师思维,形成了鲜明反差。

内森总结出中美AI文化四大核心差异,每一点都直击要害:

1. 国内团队愿意深耕模型优化的基础工作,美只热衷追逐易出圈的研究方向。

2. 国内新人学习能力强无思维桎梏,美方资深从业者固守传统经验。

3. 国内团队协作性强,规模扩张无内耗,美方团队壮大后极易产生内部矛盾。

4. 国内人才擅长落地解决成熟问题,美方人才扎堆追逐全新领域、创造新课题。

他也客观表示,在0到1的基础原创研究上,我们和美国仍有差距。

但当下大模型比拼落地能力、迭代效率的阶段,中国的研发文化,就是妥妥的版本答案。

打破三大西方对中国AI的刻板偏见。

这场实地走访,让内森亲手撕碎了西方社会根深蒂固的三大认知误区。

误区一:国人不愿为软件付费。

西方投资人一直固有认知:中国SaaS市场低迷,AI商业化更是无从谈起。

内森直言:本质是你们的产品实力太差。

尽管Claude并未正式进入国内市场,但国内AI从业者几乎都在使用,且愿意主动充值会员。

国人从来不是抗拒付费,只是拒绝为低效劣质的产品买单。

国内AI企业更是笃定,只要打造出十倍体验的产品,自然会收获市场认可。

误区二:美团小米布局AI只是凑热闹。

在西方人眼中,外卖平台、手机厂商入局大模型,纯属跨界跟风。

内森交流后才明白,国内企业早已将大模型视作科技行业的水电煤般的基础设施。

核心技术命脉若掌握在他人手中,自身业务随时会被扼喉,即便研发难度大、投入成本高,自研也是必然选择。

更巧妙的是国内企业的开源思路:

先开源通用模型底座,汇聚全球开发者测试漏洞、拓展应用场景,再结合自身业务微调定制专属版本。

开源从来不是情怀,而是最高效的研发方式,这波操作也让海外从业者大为震撼。

误区三:中国AI只会照搬模仿。

这是西方对中国AI最大的误解。

通过和国内研究员深度探讨技术细节,内森发现,我们对大模型的底层理解,完全不输海外顶尖团队。

在工程化落地、场景化应用层面,不少国内企业已然实现超前布局。

同时他也不避讳点出我们现存的短板:

▪️ 算力层面:英伟达芯片依旧是大模型训练的核心选择,国内算力仍有缺口,不过华为芯片已在推理场景获得广泛应用。

▪️ 数据层面:国内公开数据质量参差不齐,企业纷纷自建标注与训练体系,也练就了一身全栈研发的硬实力。

揭秘中国AI圈不为人知的行业生态。

在内森眼中,如今的北京,早已和硅谷别无二致。

AI企业遍地生根,同行企业比邻而居,行业人才流动频繁,创新氛围浓厚。

但二者的生态内核截然不同:

中国AI圈是共生生态,美AI圈是封闭部落。

图片

美同行之间互相攻讦、恶意攀比,总想压制对手发展;

国内企业即便市场竞争白热化,私下依旧保持技术交流,彼此尊重共进。

他还捕捉到国内AI圈两大心照不宣的共识:

1. 全行业都在关注字节跳动豆包,作为国内少有的闭源模型,实力备受瞩目。

2. DeepSeek被业内公认为国内研究品位顶尖的实验室。

谈及商业化发展,国内研究员大多表示:商业化并非研发端的首要考量。

这和美国AI圈从上到下人人追捧估值、谋求上市的浮躁氛围,形成了鲜明对比。

刻在骨子里的建设精神,是中国AI的底气。

内森在文章的结尾,提出了一个始终想不通的问题:为何中国企业愿意将耗资数千万、数亿训练而成的大模型,无偿开源分享给全球?

这群从业者并非狂热的开源信徒,只是发自内心想要扶持开发者、搭建行业生态。

骨子里守住核心技术自主可控的执念,怀揣着永不停歇的建设热忱。

就像街头随处可见的起重机,始终破土动工,持续创造全新的价值。

身为美国从业者,他自然希望本国维持AI领先优势,但也发出郑重警告:

若美国政府盲目限制开源技术交流,最终输掉的只会是自己。

看完这篇深度观察,内心感慨万千。

中国AI的崛起,从来不是所谓的弯道超车,也并非单纯依靠政策扶持。

而是一群脚踏实地,愿意俯身干脏活累活,秉持实干精神的从业者,一步步拼出来的。

我们清晰知晓自身的不足:高端芯片、基础原创理论、底层科研……这些都需要时间慢慢追赶。

但不可否认,我们已然走在了正确的发展道路上。

全球AI的竞技赛场,才刚刚拉开序幕。

如今的中国,早已成为任何人都无法忽视的强劲对手。

💬 互动话题

你觉得中国AI后续会在哪一领域实现对美的超越?

是大模型底层技术,还是AI场景化应用?

欢迎在评论区留下你的观点!

觉得文章干货满满,别忘了点赞+关注哟。

带你每日捕捉前沿AI动态,揭秘AI圈不为人知的行业趣事~

免责声明:本文内容基于内森·兰伯特个人博客文章整理,仅代表作者个人观点,仅供参考。