前沿技术速报 | ChatGPT Images 2.0 进入思考时代,SpaceX 600亿收购 Cursor

12 阅读10分钟

🤖 AI/大模型动态

1. OpenAI 发布 ChatGPT Images 2.0:图像生成进入"思考"时代

OpenAI 正式推出 ChatGPT Images 2.0,这次升级的本质不是"更好看的图",而是让图像生成具备了推理能力。新版本引入"thinking"模式——生成过程中可联网搜索实时信息、生成多张候选图并自我复核,奥特曼亲自演示了"大米刻字"级别的精细渲染。技术指标上支持 3:1 到 1:3 的任意宽高比,中日韩多语言文本渲染精度大幅提升,API 最高支持 2K 分辨率。OpenAI 将其定位为从"渲染工具"到"策略性设计引擎"的进化。该能力已向所有 ChatGPT、Codex 和 API 用户开放,对设计行业冲击巨大。

来源:36氪 | Hacker News

2. SpaceX 600 亿美元收购 Cursor:航天巨头跨界 AI 编程

SpaceX 官方宣布以 600 亿美元收购 AI 编程助手 Cursor,这笔交易令人意外——一家航天公司为何要花天价买代码补全工具?从战略角度看,SpaceX 的软件工程团队规模庞大(星舰、星链的控制软件复杂度极高),Cursor 的 AI 编程能力可以显著加速内部开发。更深层的逻辑可能是:SpaceX 正在从航天公司转型为科技平台,而 AI 编程是所有技术栈的底层能力。这笔交易也是 AI 编程赛道估值飙升的标志性事件——Cursor 年化收入约 5 亿美元,600 亿估值意味着 120 倍市销率。

来源:Hacker News

3. 谷歌深夜发布 Deep Research 智能体,布林亲自督战围剿 Claude

Anthropic 的 Claude 在 AI 编程领域的碾压式领先让谷歌坐不住了。一方面,谷歌 DeepMind 组建了由联合创始人布林亲自盯的"strike team",内部数据显示 Anthropic 代码几乎 100% 由 Claude 编写,而谷歌仅为 50%;Claude Code 年化收入已达 25 亿美元,企业编程市场份额 54%。另一方面,谷歌深夜推出基于 Gemini 3.1 Pro 的 Deep Research 智能体,支持 MCP 协议可安全查询私有数据库,原生生成图表,试图从"网页搜索工具"升级为"通用数据分析师"。但目前仅限 API 用户,普通用户还体验不到。

来源:36氪

4. DeepSeek 首次外部融资:估值 100 亿美元,梁文锋"太保守了"

DeepSeek 正在进行不低于 100 亿美元估值的首次外部融资。触发原因很现实——R1 爆红后核心研究员被字节、小米、腾讯疯抢,由于此前没有市场估值,DeepSeek 连期权都发不出来。但文章认为 100 亿估值反而"太保守了":DeepSeek 的高性价比训练方法论(不依赖英伟达)可能在国产 GPU 上训练出不输 Claude 的开源模型,这对整个 AI 格局的冲击是颠覆性的。不过目前 DeepSeek 的模型性能已被 Claude、Gemini 压制,商业化能力也偏弱,估值更多建立在"可能性"之上。

来源:36氪

5. 阿里 Wan2.7-Image 登顶国内人类偏好盲测,具身智能匿名模型 MotuBrain 拿下两个世界第一

阿里发布 Wan2.7-Image 模型,在国内人类偏好盲测评分中位列第一。与此同时,一款名为 MotuBrain 的匿名世界模型同时登上 WorldArena(世界预测能力)和 RoboTwin 2.0(机器人任务执行能力)两个国际 benchmark 榜首——在 RoboTwin 2.0 随机环境下平均分超 95,是唯一做到这一点的模型。这一"双料第一"验证了"把预测世界和驱动行动统一在同一个模型里"的路线可行,具身智能圈大佬们纷纷猜测其来源,神秘感拉满。

来源:量子位 | 36氪

◆  ◆  ◆

💻 科技创新

6. GitHub Copilot 个人版重大调整:暂停新注册、收紧限制

GitHub 宣布对 Copilot 个人版计划进行重大调整——暂停新用户注册、收紧使用限制、调整模型可用性。根本原因是 AI Agent 工作流对计算资源的需求远超原始设计容量。当开发者开始用 Copilot 跑自动化任务而非单纯代码补全时,算力消耗呈指数级增长。GitHub 引入了更透明的使用限制显示机制,但这暴露了一个深层矛盾:AI 编程工具的"按月订阅"商业模式在 Agent 时代可能不可持续——用户的使用量没有上限,但服务器成本有。

来源:Hacker News

7. Meta 开始采集员工鼠标和键盘数据训练 AI,隐私争议再起

据路透社报道,Meta 将开始采集员工的鼠标移动轨迹和键盘敲击数据用于训练 AI 模型。这一做法引发了激烈的隐私和伦理讨论——虽然 Meta 声称数据用于改进 AI 系统,但批评者认为这本质上是在工作场所建立全方位监控机制。从技术角度看,鼠标轨迹和键盘数据确实能捕捉人类操作的细微模式,对训练 GUI 自动化 Agent 有价值;但从劳动关系角度看,这开创了一个危险的先例:你的日常工作行为本身正在成为公司的训练资产。

来源:Hacker News | 路透社

8. Codex 新增"Chronicle"桌面截屏功能,隐私风险引关注

OpenAI 为 Codex 推出 Chronicle 功能——后台周期性截取用户屏幕截图,通过 OCR 和视觉分析生成 Markdown 摘要后作为上下文供 Codex 使用,奥特曼称之为"心灵感应"。目前仅支持 macOS、限 ChatGPT Pro 用户(100 美元/月)。但风险也不小:rate limit 消耗快、prompt injection 攻击面增大、记忆以明文未加密形式存储在本地。微软 Recall 和 Rewind AI 的前车之鉴显示,桌面屏幕感知赛道的隐私挑战仍是最大障碍。OpenAI 官方建议:开会前记得关。

来源:36氪

9. Vercel 遭 OAuth 供应链攻击,平台环境变量安全风险暴露

安全研究人员披露 Vercel 平台遭遇 OAuth 供应链攻击,攻击者通过 OAuth 流程的漏洞获取了平台环境变量中的敏感数据(API 密钥、数据库凭据等)。这一事件之所以引发广泛关注,是因为 Vercel 是大量前端和全栈项目的部署平台,环境变量中存储的往往是生产环境的核心凭据。对开发者来说这是一个明确的信号:不要把所有密钥都放在一个平台的环境变量里,考虑使用独立的密钥管理服务。

来源:Hacker News

10. Flipper Zero 能改商店价签了:电子标签安全堪忧

一个名为 TagTinker 的开源项目展示了如何用 Flipper Zero 设备编辑商店的电子价格标签。虽然项目定位为安全研究,但它暴露了零售行业电子标签系统的普遍漏洞——很多电子标签的通信协议缺乏加密,任何人都可以用廉价硬件覆盖显示内容。随着越来越多零售商转向电子价签(成本更低、更新更方便),这个问题可能从"极客恶作剧"升级为实际的商业欺诈风险。

来源:Hacker News

◆  ◆  ◆

🔬 前沿研究

11. 贝索斯 100 亿美元押注"物理 AI":让 AI 从物理世界的试错中学习

贝索斯旗下的 AI 创企 Project Prometheus 即将敲定 100 亿美元新融资,估值 380 亿美元,投资方包括摩根大通和贝莱德。这家公司走了一条与主流大语言模型截然不同的路线——让 AI 从物理世界的试错中学习,目标落地航空航天、汽车等领域的工程制造。核心团队多位研究员来自 OpenAI、DeepMind 和 Meta。叠加此前 62 亿美元首轮融资,该公司已成全球资金最充裕的早期 AI 创企。贝索斯的太空业务(Blue Origin)显然是最大的潜在客户——火箭设计中的流体力学、材料科学优化正是"物理 AI"的理想场景。

来源:36氪

12. 工业 AI "卡"在哪了?仅 15% 实现规模化落地

尽管全球 70% 制造企业已引入 AI,但麦肯锡数据显示真正实现规模化落地的仅约 15%,IDC 统计基础工业软件中应用 AI 的占比仅 9%。核心卡点有三:工业知识难以被通用大模型理解(老师傅的经验无法用文本描述)、工业数据碎片化且缺乏标注标准、跨工序的协同优化需要深厚的领域 know-how。八部门政策要求到 2027 年形成 1000 个工业智能体和 500 个典型场景,但现实是工业 AI 目前仍停留在质检、调度等"单点突破"阶段,离体系化落地还很远。

来源:36氪

◆  ◆  ◆

📊 行业观察

13. AI 越强,大厂股价越惨:一个反直觉的估值悖论

文章指出了一个反常现象:AI 非但没有给科技大厂带来估值溢价,反而成了"估值杀手"。微软虽是全球第一个靠 AI 赚大钱的公司,但市场担忧 AI 会替代传统 SaaS,PE 已跌至 10 年最低;Palantir 被"大空头"伯里做空,认为 AI 时代应该即插即用而非传统部署模式;腾讯则担心豆包等通用智能体可能颠覆社交关系和小程序生态。本质矛盾在于:AI 既是增长引擎也是颠覆力量——市场对"被颠覆"的恐惧超过了对"增长"的喜爱。

来源:36氪

14. GitHub Star 造假产业链:AI 项目是重灾区,5 毛一颗

卡内基梅隆大学 ICSE 2026 论文揭露 GitHub 刷星产业链:平台上存在约 600 万颗假 Star,分布在 1.8 万多个仓库,背后是超过 30 万个造假账号,AI/LLM 项目是重灾区。造假已形成分层定价体系(0.03-0.90 美元/颗),带 5 年 commit 记录的老号能卖到 5000 美元。驱动力在于 VC 投资中 Star 数量已成为融资门槛——种子轮中位数 2850 颗,花几百美元买星换几百万融资,ROI 高达 117000 倍。

来源:36氪

15. 豆包 vs 千问:争夺 AI Agent 的"开机键"

字节豆包选择以"操作系统级合作"切入 AI 手机赛道,在系统层面获得屏幕 UI 识别和模拟操作权限;阿里千问则押注 AI 眼镜,首批上线话费充值、扫码骑车等"AI 办事"能力。两条路径的本质相同——在 Token 消耗链路最前端建立物理节点。千问 AI 眼镜用户交互频次比手机 AI 助手提升约 6 倍,但豆包的判断是 Ray-Ban Meta 已占全球 85.2% 市场份额,主流范式已被统一,所以暂停了 AI 眼镜项目。终局护城河只有一条:用户习惯了从哪个入口触发 Agent。

来源:36氪

◆  ◆  ◆


数据来源说明:36氪、Hacker News、量子位、路透社等公开信息源。