超遥远的鑫星的个人主页 - 动态

赞了这篇文章

问题解决官 @juejin.cn

·

2月前

AI 能写代码，但它造不出软件

# AI 能写代码，但它造不出软件最近，我收到越来越多这样的消息：陌生人发来一段 AI 生成的代...

37

11

赞了这篇文章

1月前

AI大模型原理与API使用

一、AI基础知识 1. 什么是AI？ AI（人工智能）的核心目标是让机器能够执行通常需要人类智能的任务，例如语言理解、图像识别、复杂问题解决等。早期阶段：以规则为基础的专...

2

1

赞了这篇沸点

1月前

#每日快讯# GPT-5.2 上线！全面超越 Claude Opus4.5 及 Gemini 3.0 Pro

OpenAI 昨夜突袭发布 GPT-5.2，直接把 2025 年 AI 军备竞赛推向终局。我们用 3 组硬核数据告诉你，为什么这次真的「变天」了。

📊 核心指标碾压
GDPval 基准测试
GPT-5.2: 70.9% | Claude Opus 4.5: 52% | Gemini 3 Pro: 43.3%

*该测试覆盖1320个真实职场任务，包括制作急诊排班表、制造业流程图等

长文本处理：GPT-5.2 的 40 万 token 上下文窗口，相当于一次性读完《三体》三部曲+《冰与火之歌》前五卷，而 Claude 4.5 仅支持 20 万 token。代码实战：在 SWE-bench Pro 测试中，GPT-5.2 Thinking 以 55.6% 的成绩刷新纪录，比 GPT-5.1 提升 24%，这意味着它现在能独立解决超过一半的 GitHub 真实 issue。价格暗战：虽然 API 定价上涨 40%（每百万 token 21 美元），但 OpenAI 强调「单次任务完成率提升 3 倍」，实际成本反而下降。

🎯 实测对比
Excel 自动化：GPT-5.2 3分钟生成带宏的财务模型，Claude 需要12分钟
多轮对话记忆：连续50轮技术讨论后，GPT-5.2 仍记得第3轮提到的边缘案例
图像理解：直接读取手绘架构图并生成可运行的 React 代码

企业级彩蛋：Box 测试显示，GPT-5.2 处理生命科学文档速度提升 40%，医药公司已经开始用它分析临床试验数据。当竞争对手还在卷参数时，OpenAI 用 400k 上下文+70% 专业任务通过率，直接定义了「下一代 AI 助理」的及格线。现在压力给到 Google 和 Anthropic——2026 年的 Project Garlic 会是什么怪物？

🚀 你觉得 GPT-5.2 会先颠覆哪个行业？

Gemini 3.0 Pro 2025年11月18号发布的时候也是这么说的，全面超越Open AI及其他所有模型。