盘点 2024 年 AI 大事件，中国 AI 的破晓之年大家好，我是童欧巴。 2024 年，AI 已经完全成为了科技发展

大家好，我是童欧巴。

2024 年，AI 已经完全成为了科技发展的主旋律。

在这个本就瞬息万变的时代，AI 所带来的影响正以前所未有的速度，改变着我们的生活、工作和思维方式，甚至正在改变和重构整个社会的生产关系。

而你我如何才能驾驭这场浪潮的选择，将决定我们每一个人的未来。

这篇文章我将带你盘点 2024 年 AI 圈的大事件，希望能够在岁末年初，回顾了解 AI 时代的最新进展。

让我们一起认真思考，共同进步，迎接新时代的到来。

盘点 2024 年 AI 大事件

2024 年 2 月 15 日，谷歌推出 Gemini 1.5 Pro。

2024 年 2 月 16 日，OpenAI 推出首个文生视频模型 Sora。

2024 年 3 月 14 日，Anthropic 发布 Claude3 全家桶。

2024 年 3 月 18 日，英伟达 GTC 大会，发布新一代 Blackwell GPU 架构。

2024 年 5 月 7 日，DeepSeek v2 发布。

2024 年 5 月 9 日，谷歌 DeepMind 推出 AlphaFold3。

2024 年 5 月 14 日，OpenAI 发布 GPT-4o。

2024 年 6 月，英伟达超越微软，登上全球市值最高公司的宝座。

2024 年 6 月，Anthropic 发布 Claude 3.5 Sonnet。

2024 年 7 月 23 日，Meta 发布 Llama 3.1-405B 开源模型。

2024 年 9 月 12 日，OpenAI 发布 o1-preview。

2024 年 10 月，诺贝尔物理学奖和化学奖被授予 AI 科学家。

2024 年 10 月，Anthropic 推出升级版 Claude 3.5 Sonnet，支持像人一样操控计算机。

2024 年 9 月 13 日，李飞飞宣布成立新型实验室 World Labs。

2024 年 12 月，特斯拉推送 FSD V13。

2024 年 12 月 3 日，World Labs 推出首个空间智能模型。

2024 年 12 月 11 日，Gemini 2.0 Flash 的实验版本正式亮相。

2024 年 12 月 21 日，OpenAI 推出 o3。

2024 年 12 月 26 日，DeepSeek v3 发布。

谷歌 DeepMind 推出 Gemini 1.5 Pro

2024 年 2 月 15 日，谷歌推出 Gemini 1.5 Pro，直接创下了最长上下文窗口的新记录 🔗官方报道

模型的上下文窗口有多重要呢？简单来说，窗口越大，它就能接纳越多的信息，处理能力越强。而这次 Gemini 1.5 Pro 把上下文窗口卷到了 100 万 token，理论极限甚至可以达到 1000 万 token。

100 万 token 意味着什么呢？🤔

它可以是 1 小时的视频、11 小时的音频、超过 30,000 行代码的代码库，或者超过 700,000 个单词。

OpenAI 推出首个文生视频模型 Sora

202 4年 2 月 16 日，OpenAI 推出首个文生视频模型Sora 🔗官方报道

Sora 的推出，被视为革命性的技术突破，意味着 AI 可以理解和模拟真实世界，具有里程碑意义。

2024 年也由此正式开启了“AI 视频生成的元年”。

这一年，真是热闹非凡。🧨

可灵即梦海螺混元 Runway Pika Veo2 PixVerse

接连发布，让人眼花缭乱。

不过，Sora 的正式版直到 12 月才姗姗来迟。经过了一整年的视频生成热潮，结果它并没有带来更多的惊喜。行业的变化和模型的进化速度，真的是让人难以想象 🔗官方报道

初创公司 Anthropic 发布 Claude3 全家桶

2024 年 3 月 14 日，Claude3 全家桶的推出，居然让初创公司 Anthropic 超越 OpenAI 🔗官方报道

除了传统科技巨头之外，新的挑战者出现了，大模型的竞争格局被彻底打破。

在大模型领域，技术领先没有一成不变的局面，是竞争不断推动着进步。🌊

英伟达 GTC 大会，发布新一代 Blackwell GPU 架构

2024 年 3 月 18 日，英伟达的 GTC 大会，发布新一代 Blackwell GPU 架构。

但这已经不仅仅是一场关于 GPU 技术的峰会，简直成了全球 AI 开发者的顶级盛会。

🧙 英伟达用了 8 年时间，将单卡训练性能提升了 1000 倍，大家都惊呼：摩尔定律已死，老黄定律正式登基。

掌握 AI 发展命脉的英伟达，在 2024 年 6 月超越微软，历史性地登上了全球市值最高公司的宝座。

而这一逆袭之旅，英伟达花了足足 30 多年。

Deepseek 发布开源模型 V2

2024 年 5 月 7 日，Deepseek V2 荣登全球开源模型榜首，成为最强的开源 MoE 语言模型。它主打低训练成本和更高效的推理性能 🔗官方报道

它的计算量仅为 Llama-3 70B 的 1/5，GPT-4 的 1/20，API 价格只有 GPT-4-Turbo 的百分之一。

🔋 AI 界的拼多多

紧接着，5月，国内众多云厂商纷纷降价，推理算力价格下降了 90% 以上，掀起了一场价格战。

谷歌 DeepMind 推出全新的生命分子结构的预测模型 AlphaFold3

2024 年 5 月 9 日，谷歌 DeepMind 推出全新的生命分子结构的预测模型 AlphaFold3。🔗官方报道

直接将预测范围，从蛋白质结构扩展到大部分生命分子(如 DNA 和 RNA等)，准确率提高了一倍，将打开超过 1000 亿美元的药物研发市场，帮助人类进一步探究“生命的终极秘密”。

OpenAI 发布 GPT-4o

2024 年 5 月 14 日，OpenAI 发布了 GPT-4o，具备多语言和多模态（如文本、图像、音频等）的处理能力 🔗官方报道

大模型与人类的互动原来可以如此自然流畅，实时语音对话的反应时间，平均仅为 320 毫秒，已经达到了人类的水平。

同时它在情感表达、理解和记忆方面能够具备很强的能力，相信很快，人人都能有一个 AI 个人助理了。

Anthropic 发布 Claude 3.5 Sonnet

2024 年 6 月，Anthropic 发布了 Claude 3.5 Sonnet，10 月又推出了升级版，支持像人一样操控计算机，开启了人机交互的新范式 🔗官方报道

🤖 2025 年被普遍看作是智能体系统的元年。

在这一年之内，Anthropic 三次成功超越 OpenAI，成为了 OpenAI 最强劲的竞争对手。

Meta 发布 Llama 3.1-405B 开源模型

2024 年 7 月 23 日，Meta 发布 Llama 3.1-405B 开源模型，标志着开源模型进入了一个全新的时代，可以和闭源模型平分秋色。🔗官方报道

领先的开源模型不仅为更多公司提供了发展红利，也大大降低了 AI 开发的门槛，推动了技术的普及。

OpenAI 发布 o1-preview

2024 年 9 月 12 日，OpenAI 发布 o1-preview。🔗官方报道

在物理、生物、化学等领域的能力首次超过博士水平，成为第一个具备真正通用推理能力的大模型，革命性的引入了基于强化学习的内化思维链学习，让人们看到了通往 AGI（通用人工智能）的曙光。

诺贝尔物理学奖和化学奖被授予 AI 科学家

2024 年 10 月，诺贝尔物理学奖和化学奖都颁给了 AI 科学家，意味着 AI 技术在科学研究中的重要地位得到了认可，AI 正在给所有科学带来变革。

物理学奖：John Hopfield 和 Geoffrey Hinton 化学奖：Demis Hassabis 和 John Jumper(以及 David Baker)

李飞飞成立 World Labs

2024 年 9 月 13 日，李飞飞宣布成立 World Labs，并亲自担任 CEO，旨在探索空间智能。

2024 年 12 月 3 日，推出首个「空间智能」模型，一张图像就能生成一个 3D 物理世界。

场景遵循了基本的物理规则，具有真实的空间感。可以像真实世界一样稳定存在，并可以在其中实时自由移动。🔗官方报道

🔭 李飞飞曾分享了自己关于空间智能的思考：

所有空间智能的生物所具备的行动能力，是与生俱来的。因为，它能够将感知与行动进行关联。

如果想让 AI 超越其自身当前的能力，我们需要的是，不仅仅能够看到、会说话的 AI，而是一个可以行动的 AI。

特斯拉 FSD V13

2024 年 12 月，特斯拉推送 FSD V13，迎来重大能力升级，相比 V12.1 提升至少 150 倍。

🚗 特斯拉有望在 2025 年超越人类驾驶能力，率先走向 L4。

谷歌 DeepMind 推出 Gemini 2.0

2024 年 12 月 11 日，Gemini 2.0 Flash 的实验版本正式亮相，是 Gemini 2.0 系列的第一个模型，也是当前主力模型。🔗官方报道

2.0 Flash 在关键基准测试中甚至以两倍的速度超越了 1.5 Pro，支持图像、视频、音频等多模态输入，可生成图文混合内容和多语言 TTS 音频。模型原生支持 Google 搜索、代码执行及第三方 API 调用等工具链能力。　

OpenAI 推出 o3

2024 年 12 月 21 日，当大家以为 AI 发展放缓时，OpenAI 在 12 月发布季最后一天推出 o3。🔗官方报道

彻底击败了原有的人工通用智能评估基准，再次改变游戏规则，碾压全场。

🪜 似乎证明了通往 AGI 的路上，已经没有了任何阻碍。

o3 在极短的时间内证明了 AI 的进步，仅仅依赖于简单的扩大模型规模和增加训练数据是不够的。

架构创新也同样重要，这一方法为未来 AGI 的下一步探索指明了方向。

DeepSeek 发布 V3 模型

2024 年 12 月 26 日，神秘的东方再次震惊了世界，DeepSeek 发布了 V3 模型，不仅全球开源排名第一，而且性能比肩世界顶尖模型 GPT-4 和 Claude-3.5-Sonnet。🔗官方报道

V3 模型的训练成本仅为 558万美元，是 Llama 3 405B 的 1/11，不到 GPT-4 的1/10。

这证明了大模型预训练仍有巨大的优化空间，DeepSeek 开辟了一条在有限资源下实现技术追赶和超越的新路径，同时为中国人工智能的技术发展提供了新的思路和解决方案。

🏆 前阿里副总裁贾扬清也感慨道，DeepSeek 团队的伟大成就，某种程度上源自于多年的专业积累，这些专业知识往往被许多人忽视。

好了，2024 年 AI 大事件就总结到这里了。

如果你觉得有收获，欢迎点赞转发，也欢迎在评论区许下你的新年愿望。

2025 年，祝你获得成长、健康和财富。

在这个瞬息万变的 AI 时代：

愿你既能轻松应对这个疯狂的大世界，也能有自己热闹的小生活。

❤️爱心三连击

1.如果你觉得欧巴的文章还合胃口，就点个赞支持下吧，你的赞是我最大的动力。

2.关注>>>公众号欧巴聊AI，AI 时代陪你一起成长。

3.点赞、评论、转发 === 催更！