王炸!OpenAI推出两款新型 AI 推理模型:o3 和 o4-mini(附一些使用方式)

322 阅读8分钟

北京时间4月17日凌晨,OpenAI 发布了两款突破性AI模型——o3和o4-mini,它们能通过图像进行推理,并可自主调用多种工具,被专家称为人工智能能力的一次飞跃式提升。

这两款模型都是OpenAI “o 系列” 推理模型的最新成员,经过训练后,它们可在响应前进行更长时间的思考。同时,它们也是OpenAI迄今发布的最智能、最强大的模型。

这些推理模型可以自主组合并使用ChatGPT内的所有工具——包括网页搜索、利用Python分析上传的文件和数据、对视觉输入进行深入推理,甚至还能生成图像。即能够「将图像直接融入其思维链中」。

这么说可能你们不太理解,引用数字生命卡兹别克博主测试的例子。

一个非常经典的游戏,就是看图猜地点,但是不是那种没啥难度的,城市题,说实话,有建筑,太好猜了。

我们直接进一个专门玩这个的网站,叫图寻,参加每日挑战。

我的第一题,就是这个。

对,就这么个东西,让你猜这是中国的哪,在右下角的地图上打标,离终点越近,分越高。

我直接把这个扔给了o3,我们来看看,他的思考过程。

非常离谱的,自己去看图,把图片放大,一点一点思考,这个地方不对,哎换个地方我再放大看看。以前模型的思维链,只有文字,而这次,这是大模型第一次,真正的把图片,也融入到了推理中。我们再回过头来看看,刚才那道猜地题,它给出的答案。

虽然没有那么肯定,但是也给出了答案,北京门头沟、房山,109国道,妙峰山那一段。

我们来揭晓答案。

可能有些人对这个地点不熟悉,这个地方,叫北京,门头沟,109国道,妙峰山。

这一刻真的有种说不出来的感觉喔!

这意味着它们能更高效地应对多层次、多步骤的问题,让ChatGPT具备“自主执行任务”的能力。将顶级推理能力与完整工具访问权限结合在一起,让这些新模型在学术评测和实际任务中的表现都有了显著提升。

言归正传,接下来来说下o3和o4-mini的对比和差别。

o3:迄今为止最强的通用推理模型

OpenAI o3 是目前最强大的推理型模型,专为应对复杂、多步骤的任务而打造,广泛适用于编程、数学、科学分析、图像理解等领域。

它在多个权威基准测试中创下新纪录,包括:

  • Codeforces 编程排名
  • SWE-bench 软件工程测试(无需构建自定义脚手架)
  • MMMU 多模态任务测试

不仅如此,o3 在图像、图表和视觉感知任务中表现尤为出色。对于需要图像分析、图表解读等多模态输入的复杂问题,o3 能给出结构化、深入且精准的回答。

o4-mini:更小、更快、更高效

与 o3 不同,o4-mini 是一款轻量级、优化后的高性价比推理模型,在计算资源、响应速度与实际效果之间达成了优秀的平衡。

亮点包括:

  • AIME 2024 和 2025 数学竞赛中表现最佳
  • 在非 STEM 任务(如数据科学)中的表现超越 o3-mini
  • 数学、编程、图像识别任务中效率极高

✅ 由于模型本身更轻量,o4-mini 支持更高的调用频率和更低的成本,非常适合大批量、多并发、快响应的应用场景。

🗣️ 更自然的人机互动体验

无论是 o3 还是 o4-mini,这一代模型在对话体验上也有明显提升。得益于智能水平的增强与网络信息的集成支持,两款模型都能更好地理解用户意图,提供可验证、结构清晰的回答。

  • 支持上下文记忆引用,更贴合用户历史对话
  • 指令遵循能力增强,响应更精准自然
  • 更加个性化、情境感知的交互

🔍 模型主要对比亮点

模型优势亮点次数
o3推理最强,图像理解领先,适用于高复杂任务和之前o1次数保持一致
o4-mini高性价比,适合大规模调用,非 STEM 场景表现跃升和之前o3-mini次数保持一致

外部专家一致认为,新模型在可用性、可靠性和语言自然度上均优于前代产品,是未来 AI 助手的重要里程碑。

从今天开始,ChatGPT Plus、Pro和Team 用户将在模型选择器中看到 o3、o4-mini 和 o4-mini-high。ChatGPT Enterprise 和 Edu 用户将在一周后获得访问权限,所有计划的速率限制与之前的模型保持不变。

同时GPT-4 将于 4 月 30 日从 ChatGPT 中正式下线,由各方面都更强的 GPT-4o 全面替代。原来的o1、o3-mini、o3-mini-high也下线啦,全面由o3、o4-mini 和 o4-mini-high接棒!

📌 总结

OpenAI 的 o3 与 o4-mini 的发布,标志着 AI 推理模型的又一次跃迁。从性能到体验,从通用性到多模态理解,它们都展现出前所未有的能力。

如果你在寻找一个既能处理复杂问题,又能快速响应且个性化的 AI 模型,这一代产品值得你深入了解与使用。

📌 一些使用方式

当然,千言万语都不如你自己实际体验,所有分享一些使用方式,各位自行体验使用即可!

1、OpenAI官网

没错,如果有能力还是直接去官网使用吧,体验相当nice。

就是价格稍微贵,需要20美刀,不过这个价格打包市面上OpenAI对话模型、视频、图片、语音给你使用。我觉得也合理。毕竟免费才是最贵的。

使用地址:chatgpt.com/

2、爱发电

国内大佬主要做解决GPT4o和Claude使用的公益服务网站,目前已同步官网o3和o4-mini。

但是最近因为项目经常被攻击,目前采用订阅方式使用,感兴趣的可以自己去了解。本来是公益的,现在限制了一下防止攻击,需要订阅了。

公益网址我这边没去赞助,没拿到喔,想了解自己去看看吧!

使用地址:afdian.com/a/warmo

3、工作区-Salck

大佬通过OpenAI官网的API在Slack配置的一个应用。 加入他的Slack工作区就能直接使用GPT-4o、Gemini模型。而且工作区里面还有Claude3.7系列模型可以使用。目前Slack可以在电脑、手机、网页使用,可以说是很方便了。

注意,加入工作区一般需要使用国际邮箱,用微软的outlook邮箱就好了。首次加入需特殊环境(需自行准备) 。加入完进入工作区在频道@GPT4应用即可。 工作区加入链接:h5ma.cn/jxn

4、模型竞技场

进入竞技场后点击DIRCTChat,然后选择4o模型就好。

需要注意的是,模型竞技场有些时候会因为没有次数额度下架4o模型使用。你可以去试试看,如果没有的该模型选项的话,晚会再进去试试。

注:首次进入稍微卡,需要等待一会。

使用地址:h5ma.cn/lpi

5、chatshare

国内最大的镜像站之一,主要提供OpenAI和Claude的镜像服务。目前账号充足,采用自购账号和API方式接入官网服务。运行时间长,可靠稳定。

注册后需使用激活码订阅,订阅完成即可使用。具体不多说,需要的可自行了解。

使用地址:chatshare.biz

激活码获取:h5ma.cn/chatjhm

6、Poe

一个海外AI模型聚合平台,提供各种各样的模型体验。市面上热门的o3、o4-mini、Claude3.7、GPT4o、Gemini基本都涵盖了。

但是限制次数,免费用户每天有3000积分,每日重置一次,对于o4-mini模型来说,每次对话消耗400积分(可能会调整) ,也就是每天可以免费对话8-9次。尝个鲜还是不错的。当然次数用量大,可以换号薅~

使用地址:poe.com/

7、Sider插件

Sider是一款浏览器插件,你可以在Edge浏览器和Chrome浏览器中安装它。

接入官方提供的付费稳定版API,为用户提供无需科学上网、稳定快速的服务。目前支持4o、o3、Claude3.7等等,可在国内使用。

可以帮助我们进行更正语法、改写内容、扩充内容和生成广告脚本。它支持在任何网站上使用,并提供摘要文章、解释代码等功能。

使用地址:sider.ai/invited?c=c…

8、Aichatru

俄罗斯的一个网站,可以使用4o和o1模型,但是模型应该是有次数限制的,具体多少忘记了,各位小伙伴可以自己测试。如果次数受限,可以配合大神开发的油猴脚本突破这个使用限制。

使用地址:aichatru.ru

脚本地址:greasyfork.org/zh-CN/scrip…

注意安装脚本前必须浏览器有油猴插件