刚刚,GPT-5 正式上线:幻觉大减、代码逆天,推理能力大幅提升

97 阅读3分钟

1 概述

发布时间:2025-08-08

经历无数次「跳票」后,GPT-5 终于在 8 月 8 日凌晨亮相。OpenAI 首席执行官 Sam Altman 把它比作「初代 iPhone」——用过就回不去

这一次,OpenAI 直接向全体 ChatGPT 用户免费开放体验,并一次性带来 GPT-5、GPT-5 mini、GPT-5 nano 三款模型,API 也同步上线。核心升级可以概括为一句话:

更聪明、更可靠、更快、更便宜。


2 一句话总结 GPT-5 的 5 大亮点

维度升级要点
智商Altman 直言:GPT-4 像大学生,GPT-5 像博士级专家。
幻觉联网回答错误率 ↓45%,独立思考错误率 ↓80%。
代码SWE-Bench 75% 成绩屠榜,现场 3 分钟写完 200+ 行可运行网站代码。
速度路由系统自动切换「推理增强」模式,无需手动选模型。
价格ChatGPT 用户免费体验,API 最低 0.05 美元 / 百万 tokens 起。

3 告别幻觉:GPT-5 成了「老实人」

  • 联网搜索:回答事实错误概率比 GPT-4o ↓45%。

  • 独立思考:出错概率比 o3 ↓80%。

新的 ARC-AGI-2 上的测试结果:

  • 诚实沟通:不再拍胸脯保证完成不了的任务,而是直接告诉你「我做不到」。

OpenAI 安全团队用 5000+ 小时红队测试,确保 GPT-5 不会「对用户撒谎」。

4 代码能力逆天:现场 3D 游戏秒生成

  • 基准成绩:SWE-Bench 75%、Aider Polyglot 52.8%。

  • 现场演示

    • 几分钟生成带音频、动画的法语学习网站;

  • 仅用一句提示,现场跑起一款 3D 游戏,物理效果精确还原。

Altman 放话:软件按需生成时代,来了。

5 人格模式 + 记忆联动:更像「人」的 AI

  • 4 种可选人格

    • 犬儒(Cynic)
    • 机器人(Robot)
    • 倾听者(Listener)
    • 学霸(Nerd)
  • 记忆 + Google 账号联动
    Pro / Plus / Teams 用户可把 ChatGPT 连进 Gmail 和 Google Calendar,让它提醒你「哪封邮件还没回」。下周先推 Pro 用户。

  • 主题换色:聊天窗口支持自定义配色,程序员狂喜。

6 怎么用上 GPT-5?

用户类型使用权限
免费用户直接体验 GPT-5,额度用完自动降级 mini。
Plus 用户更高额度,速度更快。
Pro 用户解锁 GPT-5 Pro(推理增强版)。
  • API 价格

    • GPT-5:输入 1.25/百万tokens,输出1.25 / 百万 tokens,输出 10
    • GPT-5 mini:输入 0.25,输出0.25,输出 2
    • GPT-5 nano:输入 0.05,输出0.05,输出 0.4
  • 企业端
    微软已同步上线:Microsoft 365 Copilot、GitHub Copilot、Azure AI Foundry 全部可用。

7 Sam Altman 的总结

  1. 使命与定位
    OpenAI 的终极目标是 AGI,GPT-5 被视为“重要一步”和“种子”,但仍非完整 AGI。

  2. 概念模糊与缺失
    Altman 直言“AGI”定义混乱,且 GPT-5 仍缺少若干关键要素,尚未达到真正的通用智能。

  3. 范式转变
    他强调 GPT-5 的独特性在于其“原生生长”特性——不是静态模型,而是能自主从发现的新事物中持续演进,这种动态能力被视为孕育 AGI 的起点。