北京时间4月17日凌晨,OpenAI 发布了两款突破性AI模型——o3和o4-mini,它们能通过图像进行推理,并可自主调用多种工具,被专家称为人工智能能力的一次飞跃式提升。
这两款模型都是OpenAI “o 系列” 推理模型的最新成员,经过训练后,它们可在响应前进行更长时间的思考。同时,它们也是OpenAI迄今发布的最智能、最强大的模型。
这些推理模型可以自主组合并使用ChatGPT内的所有工具——包括网页搜索、利用Python分析上传的文件和数据、对视觉输入进行深入推理,甚至还能生成图像。即能够「将图像直接融入其思维链中」。
这么说可能你们不太理解,引用数字生命卡兹别克博主测试的例子。
一个非常经典的游戏,就是看图猜地点,但是不是那种没啥难度的,城市题,说实话,有建筑,太好猜了。
我们直接进一个专门玩这个的网站,叫图寻,参加每日挑战。
我的第一题,就是这个。
对,就这么个东西,让你猜这是中国的哪,在右下角的地图上打标,离终点越近,分越高。
我直接把这个扔给了o3,我们来看看,他的思考过程。
非常离谱的,自己去看图,把图片放大,一点一点思考,这个地方不对,哎换个地方我再放大看看。以前模型的思维链,只有文字,而这次,这是大模型第一次,真正的把图片,也融入到了推理中。我们再回过头来看看,刚才那道猜地题,它给出的答案。
虽然没有那么肯定,但是也给出了答案,北京门头沟、房山,109国道,妙峰山那一段。
我们来揭晓答案。
可能有些人对这个地点不熟悉,这个地方,叫北京,门头沟,109国道,妙峰山。
这一刻真的有种说不出来的感觉喔!
这意味着它们能更高效地应对多层次、多步骤的问题,让ChatGPT具备“自主执行任务”的能力。将顶级推理能力与完整工具访问权限结合在一起,让这些新模型在学术评测和实际任务中的表现都有了显著提升。
言归正传,接下来来说下o3和o4-mini的对比和差别。
⚡ o3:迄今为止最强的通用推理模型
OpenAI o3 是目前最强大的推理型模型,专为应对复杂、多步骤的任务而打造,广泛适用于编程、数学、科学分析、图像理解等领域。
它在多个权威基准测试中创下新纪录,包括:
- Codeforces 编程排名
- SWE-bench 软件工程测试(无需构建自定义脚手架)
- MMMU 多模态任务测试
不仅如此,o3 在图像、图表和视觉感知任务中表现尤为出色。对于需要图像分析、图表解读等多模态输入的复杂问题,o3 能给出结构化、深入且精准的回答。
⚡ o4-mini:更小、更快、更高效
与 o3 不同,o4-mini 是一款轻量级、优化后的高性价比推理模型,在计算资源、响应速度与实际效果之间达成了优秀的平衡。
亮点包括:
- AIME 2024 和 2025 数学竞赛中表现最佳
- 在非 STEM 任务(如数据科学)中的表现超越 o3-mini
- 数学、编程、图像识别任务中效率极高
✅ 由于模型本身更轻量,o4-mini 支持更高的调用频率和更低的成本,非常适合大批量、多并发、快响应的应用场景。
🗣️ 更自然的人机互动体验
无论是 o3 还是 o4-mini,这一代模型在对话体验上也有明显提升。得益于智能水平的增强与网络信息的集成支持,两款模型都能更好地理解用户意图,提供可验证、结构清晰的回答。
- 支持上下文记忆引用,更贴合用户历史对话
- 指令遵循能力增强,响应更精准自然
- 更加个性化、情境感知的交互
🔍 模型主要对比亮点
| 模型 | 优势亮点 | 次数 |
|---|---|---|
| o3 | 推理最强,图像理解领先,适用于高复杂任务 | 和之前o1次数保持一致 |
| o4-mini | 高性价比,适合大规模调用,非 STEM 场景表现跃升 | 和之前o3-mini次数保持一致 |
外部专家一致认为,新模型在可用性、可靠性和语言自然度上均优于前代产品,是未来 AI 助手的重要里程碑。
从今天开始,ChatGPT Plus、Pro和Team 用户将在模型选择器中看到 o3、o4-mini 和 o4-mini-high。ChatGPT Enterprise 和 Edu 用户将在一周后获得访问权限,所有计划的速率限制与之前的模型保持不变。
同时GPT-4 将于 4 月 30 日从 ChatGPT 中正式下线,由各方面都更强的 GPT-4o 全面替代。原来的o1、o3-mini、o3-mini-high也下线啦,全面由o3、o4-mini 和 o4-mini-high接棒!
📌 总结
OpenAI 的 o3 与 o4-mini 的发布,标志着 AI 推理模型的又一次跃迁。从性能到体验,从通用性到多模态理解,它们都展现出前所未有的能力。
如果你在寻找一个既能处理复杂问题,又能快速响应且个性化的 AI 模型,这一代产品值得你深入了解与使用。
📌 一些使用方式
当然,千言万语都不如你自己实际体验,所有分享一些使用方式,各位自行体验使用即可!
1、OpenAI官网
没错,如果有能力还是直接去官网使用吧,体验相当nice。
就是价格稍微贵,需要20美刀,不过这个价格打包市面上OpenAI对话模型、视频、图片、语音给你使用。我觉得也合理。毕竟免费才是最贵的。
使用地址:chatgpt.com/
2、爱发电
国内大佬主要做解决GPT4o和Claude使用的公益服务网站,目前已同步官网o3和o4-mini。
但是最近因为项目经常被攻击,目前采用订阅方式使用,感兴趣的可以自己去了解。本来是公益的,现在限制了一下防止攻击,需要订阅了。
公益网址我这边没去赞助,没拿到喔,想了解自己去看看吧!
使用地址:afdian.com/a/warmo
3、工作区-Salck
大佬通过OpenAI官网的API在Slack配置的一个应用。 加入他的Slack工作区就能直接使用GPT-4o、Gemini模型。而且工作区里面还有Claude3.7系列模型可以使用。目前Slack可以在电脑、手机、网页使用,可以说是很方便了。
注意,加入工作区一般需要使用国际邮箱,用微软的outlook邮箱就好了。首次加入需特殊环境(需自行准备) 。加入完进入工作区在频道@GPT4应用即可。 工作区加入链接:h5ma.cn/jxn
4、模型竞技场
进入竞技场后点击DIRCTChat,然后选择4o模型就好。
需要注意的是,模型竞技场有些时候会因为没有次数额度下架4o模型使用。你可以去试试看,如果没有的该模型选项的话,晚会再进去试试。
注:首次进入稍微卡,需要等待一会。
使用地址:h5ma.cn/lpi
5、chatshare
国内最大的镜像站之一,主要提供OpenAI和Claude的镜像服务。目前账号充足,采用自购账号和API方式接入官网服务。运行时间长,可靠稳定。
注册后需使用激活码订阅,订阅完成即可使用。具体不多说,需要的可自行了解。
使用地址:chatshare.biz
激活码获取:h5ma.cn/chatjhm
6、Poe
一个海外AI模型聚合平台,提供各种各样的模型体验。市面上热门的o3、o4-mini、Claude3.7、GPT4o、Gemini基本都涵盖了。
但是限制次数,免费用户每天有3000积分,每日重置一次,对于o4-mini模型来说,每次对话消耗400积分(可能会调整) ,也就是每天可以免费对话8-9次。尝个鲜还是不错的。当然次数用量大,可以换号薅~
使用地址:poe.com/
7、Sider插件
Sider是一款浏览器插件,你可以在Edge浏览器和Chrome浏览器中安装它。
接入官方提供的付费稳定版API,为用户提供无需科学上网、稳定快速的服务。目前支持4o、o3、Claude3.7等等,可在国内使用。
可以帮助我们进行更正语法、改写内容、扩充内容和生成广告脚本。它支持在任何网站上使用,并提供摘要文章、解释代码等功能。
8、Aichatru
俄罗斯的一个网站,可以使用4o和o1模型,但是模型应该是有次数限制的,具体多少忘记了,各位小伙伴可以自己测试。如果次数受限,可以配合大神开发的油猴脚本突破这个使用限制。
使用地址:aichatru.ru
脚本地址:greasyfork.org/zh-CN/scrip…
注意安装脚本前必须浏览器有油猴插件。