大家好,我是童欧巴。
2024 年,AI 已经完全成为了科技发展的主旋律。
在这个本就瞬息万变的时代,AI 所带来的影响正以前所未有的速度,改变着我们的生活、工作和思维方式,甚至正在改变和重构整个社会的生产关系。
而你我如何才能驾驭这场浪潮的选择,将决定我们每一个人的未来。
这篇文章我将带你盘点 2024 年 AI 圈的大事件,希望能够在岁末年初,回顾了解 AI 时代的最新进展。
让我们一起认真思考,共同进步,迎接新时代的到来。
盘点 2024 年 AI 大事件
- 2024 年 2 月 15 日,谷歌推出 Gemini 1.5 Pro。
- 2024 年 2 月 16 日,OpenAI 推出首个文生视频模型 Sora。
- 2024 年 3 月 14 日,Anthropic 发布 Claude3 全家桶。
- 2024 年 3 月 18 日,英伟达 GTC 大会,发布新一代 Blackwell GPU 架构。
- 2024 年 5 月 7 日,DeepSeek v2 发布。
- 2024 年 5 月 9 日,谷歌 DeepMind 推出 AlphaFold3。
- 2024 年 5 月 14 日,OpenAI 发布 GPT-4o。
- 2024 年 6 月,英伟达超越微软,登上全球市值最高公司的宝座。
- 2024 年 6 月,Anthropic 发布 Claude 3.5 Sonnet。
- 2024 年 7 月 23 日,Meta 发布 Llama 3.1-405B 开源模型。
- 2024 年 9 月 12 日,OpenAI 发布 o1-preview。
- 2024 年 10 月,诺贝尔物理学奖和化学奖被授予 AI 科学家。
- 2024 年 10 月,Anthropic 推出升级版 Claude 3.5 Sonnet,支持像人一样操控计算机。
- 2024 年 9 月 13 日,李飞飞宣布成立新型实验室 World Labs。
- 2024 年 12 月,特斯拉推送 FSD V13。
- 2024 年 12 月 3 日,World Labs 推出首个空间智能模型。
- 2024 年 12 月 11 日,Gemini 2.0 Flash 的实验版本正式亮相。
- 2024 年 12 月 21 日,OpenAI 推出 o3。
- 2024 年 12 月 26 日,DeepSeek v3 发布。
谷歌 DeepMind 推出 Gemini 1.5 Pro
2024 年 2 月 15 日,谷歌推出 Gemini 1.5 Pro,直接创下了最长上下文窗口的新记录 🔗官方报道
模型的上下文窗口有多重要呢?简单来说,窗口越大,它就能接纳越多的信息,处理能力越强。而这次 Gemini 1.5 Pro 把上下文窗口卷到了 100 万 token,理论极限甚至可以达到 1000 万 token。
100 万 token 意味着什么呢?🤔
它可以是 1 小时的视频、11 小时的音频、超过 30,000 行代码的代码库,或者超过 700,000 个单词。
OpenAI 推出首个文生视频模型 Sora
202 4年 2 月 16 日,OpenAI 推出首个文生视频模型Sora 🔗官方报道
Sora 的推出,被视为革命性的技术突破,意味着 AI 可以理解和模拟真实世界,具有里程碑意义。
2024 年也由此正式开启了“AI 视频生成的元年”。
这一年,真是热闹非凡。🧨
可灵 即梦 海螺 混元 Runway Pika Veo2 PixVerse
接连发布,让人眼花缭乱。
不过,Sora 的正式版直到 12 月才姗姗来迟。经过了一整年的视频生成热潮,结果它并没有带来更多的惊喜。行业的变化和模型的进化速度,真的是让人难以想象 🔗官方报道
初创公司 Anthropic 发布 Claude3 全家桶
2024 年 3 月 14 日,Claude3 全家桶的推出,居然让初创公司 Anthropic 超越 OpenAI 🔗官方报道
除了传统科技巨头之外,新的挑战者出现了,大模型的竞争格局被彻底打破。
在大模型领域,技术领先没有一成不变的局面,是竞争不断推动着进步。🌊
英伟达 GTC 大会,发布新一代 Blackwell GPU 架构
2024 年 3 月 18 日,英伟达的 GTC 大会,发布新一代 Blackwell GPU 架构。
但这已经不仅仅是一场关于 GPU 技术的峰会,简直成了全球 AI 开发者的顶级盛会。
🧙 英伟达用了 8 年时间,将单卡训练性能提升了 1000 倍,大家都惊呼:摩尔定律已死,老黄定律正式登基。
掌握 AI 发展命脉的英伟达,在 2024 年 6 月超越微软,历史性地登上了全球市值最高公司的宝座。
而这一逆袭之旅,英伟达花了足足 30 多年。
Deepseek 发布开源模型 V2
2024 年 5 月 7 日,Deepseek V2 荣登全球开源模型榜首,成为最强的开源 MoE 语言模型。它主打低训练成本和更高效的推理性能 🔗官方报道
它的计算量仅为 Llama-3 70B 的 1/5,GPT-4 的 1/20,API 价格只有 GPT-4-Turbo 的百分之一。
🔋 AI 界的拼多多
紧接着,5月,国内众多云厂商纷纷降价,推理算力价格下降了 90% 以上,掀起了一场价格战。
谷歌 DeepMind 推出全新的生命分子结构的预测模型 AlphaFold3
2024 年 5 月 9 日,谷歌 DeepMind 推出全新的生命分子结构的预测模型 AlphaFold3。🔗官方报道
直接将预测范围,从蛋白质结构扩展到大部分生命分子(如 DNA 和 RNA等),准确率提高了一倍,将打开超过 1000 亿美元的药物研发市场,帮助人类进一步探究“生命的终极秘密”。
OpenAI 发布 GPT-4o
2024 年 5 月 14 日,OpenAI 发布了 GPT-4o,具备多语言和多模态(如文本、图像、音频等)的处理能力 🔗官方报道
大模型与人类的互动原来可以如此自然流畅,实时语音对话的反应时间,平均仅为 320 毫秒,已经达到了人类的水平。
同时它在情感表达、理解和记忆方面能够具备很强的能力,相信很快,人人都能有一个 AI 个人助理了。
Anthropic 发布 Claude 3.5 Sonnet
2024 年 6 月,Anthropic 发布了 Claude 3.5 Sonnet,10 月又推出了升级版,支持像人一样操控计算机,开启了人机交互的新范式 🔗官方报道
🤖 2025 年被普遍看作是智能体系统的元年。
在这一年之内,Anthropic 三次成功超越 OpenAI,成为了 OpenAI 最强劲的竞争对手。
Meta 发布 Llama 3.1-405B 开源模型
2024 年 7 月 23 日,Meta 发布 Llama 3.1-405B 开源模型,标志着开源模型进入了一个全新的时代,可以和闭源模型平分秋色。🔗官方报道
领先的开源模型不仅为更多公司提供了发展红利,也大大降低了 AI 开发的门槛,推动了技术的普及。
OpenAI 发布 o1-preview
2024 年 9 月 12 日,OpenAI 发布 o1-preview。🔗官方报道
在物理、生物、化学等领域的能力首次超过博士水平,成为第一个具备真正通用推理能力的大模型,革命性的引入了基于强化学习的内化思维链学习,让人们看到了通往 AGI(通用人工智能)的曙光。
诺贝尔物理学奖和化学奖被授予 AI 科学家
2024 年 10 月,诺贝尔物理学奖和化学奖都颁给了 AI 科学家,意味着 AI 技术在科学研究中的重要地位得到了认可,AI 正在给所有科学带来变革。
物理学奖:John Hopfield 和 Geoffrey Hinton 化学奖:Demis Hassabis 和 John Jumper(以及 David Baker)
李飞飞成立 World Labs
2024 年 9 月 13 日,李飞飞宣布成立 World Labs,并亲自担任 CEO,旨在探索空间智能。
2024 年 12 月 3 日,推出首个「空间智能」模型,一张图像就能生成一个 3D 物理世界。
场景遵循了基本的物理规则,具有真实的空间感。可以像真实世界一样稳定存在,并可以在其中实时自由移动。🔗官方报道
🔭 李飞飞曾分享了自己关于空间智能的思考:
所有空间智能的生物所具备的行动能力,是与生俱来的。因为,它能够将感知与行动进行关联。
如果想让 AI 超越其自身当前的能力,我们需要的是,不仅仅能够看到、会说话的 AI,而是一个可以行动的 AI。
特斯拉 FSD V13
2024 年 12 月,特斯拉推送 FSD V13,迎来重大能力升级,相比 V12.1 提升至少 150 倍。
🚗 特斯拉有望在 2025 年超越人类驾驶能力,率先走向 L4。
谷歌 DeepMind 推出 Gemini 2.0
2024 年 12 月 11 日,Gemini 2.0 Flash 的实验版本正式亮相,是 Gemini 2.0 系列的第一个模型,也是当前主力模型。🔗官方报道
2.0 Flash 在关键基准测试中甚至以两倍的速度超越了 1.5 Pro,支持图像、视频、音频等多模态输入,可生成图文混合内容和多语言 TTS 音频。模型原生支持 Google 搜索、代码执行及第三方 API 调用等工具链能力。
OpenAI 推出 o3
2024 年 12 月 21 日,当大家以为 AI 发展放缓时,OpenAI 在 12 月发布季最后一天推出 o3。🔗官方报道
彻底击败了原有的人工通用智能评估基准,再次改变游戏规则,碾压全场。
🪜 似乎证明了通往 AGI 的路上,已经没有了任何阻碍。
o3 在极短的时间内证明了 AI 的进步,仅仅依赖于简单的扩大模型规模和增加训练数据是不够的。
架构创新也同样重要,这一方法为未来 AGI 的下一步探索指明了方向。
DeepSeek 发布 V3 模型
2024 年 12 月 26 日,神秘的东方再次震惊了世界,DeepSeek 发布了 V3 模型,不仅全球开源排名第一,而且性能比肩世界顶尖模型 GPT-4 和 Claude-3.5-Sonnet。🔗官方报道
V3 模型的训练成本仅为 558万 美元,是 Llama 3 405B 的 1/11,不到 GPT-4 的1/10。
这证明了大模型预训练仍有巨大的优化空间,DeepSeek 开辟了一条在有限资源下实现技术追赶和超越的新路径,同时为中国人工智能的技术发展提供了新的思路和解决方案。
🏆 前阿里副总裁贾扬清也感慨道,DeepSeek 团队的伟大成就,某种程度上源自于多年的专业积累,这些专业知识往往被许多人忽视。
好了,2024 年 AI 大事件就总结到这里了。
如果你觉得有收获,欢迎点赞转发,也欢迎在评论区许下你的新年愿望。
2025 年,祝你获得成长、健康和财富。
在这个瞬息万变的 AI 时代:
愿你既能轻松应对这个疯狂的大世界,也能有自己热闹的小生活。
❤️爱心三连击
1.如果你觉得欧巴的文章还合胃口,就点个赞支持下吧,你的赞是我最大的动力。
2.关注>>>公众号欧巴聊AI,AI 时代陪你一起成长。
3.点赞、评论、转发 === 催更!