上周 AI 和开发者圈依然很热闹。
一边是大厂继续把 Agent 能力往生产环境里推:Claude Security 开始公测,Codex CLI 加了 /goal,Mistral Vibe 支持远程异步 Agent,OpenAI 也正式把模型、Codex 和 Managed Agents 带到了 AWS。
另一边,开源社区继续负责整活:有人把 Claude Code 的使用记录打印成热敏小票,有人给 AI 交易系统做多 Agent 框架,也有人给 Claude Code 做本地代码知识图谱,试图让 AI 少读代码、少烧 Token。
下面,开始一周回顾。
有点新鲜
「有点新鲜」收录本周 AI / 开发者圈里那些不算大新闻,但挺值得看一眼的新鲜事。
走上复古路线的 Mac mini
Mac mini 以其高性价比,一直深受广大开发者喜爱。WOKYIS 做了一个 Mac mini 好搭档:一个可以把 Mac mini 变成经典 Macintosh 造型的底座。
一切都在变复杂的时候,也许我们会开始怀念那些看起来更简单、更可爱、更有实体感的东西,比如上古 80 年代的 Apple 第一代图形用户界面电脑:Macintosh。
在一堆 Agent、API、模型参数和上下文窗口之间,突然看到一个小小的复古 Mac,确实有点治愈。此外,它的价格也相当致郁:$169.99,折合人民币约 ¥1,224 元。
在 Codex 养小宠
Codex 在 5 月 2 日宣布,客户端开始支持 Pet 功能:
用户可基于自己的需求,使用官方内置的小宠,或是自定义生成专属小宠。有才的网友 @Gruz 立马整出了 Anthropic 「愤怒版 Dario」,让 Dario 跑在你的 Codex 陪你工作:
小声 BB:Dario 就是 Anthropic 公司的创始人,曾在百度实习,也是很多中国 Claude Code 用户口中「最严厉的父亲」…
教 GitHub 开发 GitHub
本周社交媒体 X 掀起了"如果由 xx / 某个国家开发 GitHub"的风潮:
via:Andrew Qu,如果由 Palantir 来开发 GitHub。btw,Palantir 是一家美国的大数据分析公司;
via:くるくるコーラ,如果由日本企业开发 GitHub
via:Alim,如果由日本开发者来开发 GitHub
via: Jonas Fröller,如果由 EuroHub 开发 GitHub
via:琉璃,如果在中国开发 GitHub 的话…咱也不知道这个风格是哪家的产品,就是略眼熟。
鲸鱼兄弟,在哪里?
就在五一小长假的第一天,海外 DeepSeek 爱好者在 X 上召唤"鲸鱼兄弟"来试用他给 DeepSeek 开发的 TUI 工具——DeepSeek TUI。而这个开源项目将会在本周的「开源雷达」模块介绍给你。
消息一经发布,收到了国内不少热心开发者的转发,以及善意指导如何使用 WeChat。经过一天折腾无果后,Hunter Bown 最终转向 Telegram 群聊。截至昨日为止,该群已有近 3,500 名国内外开发者在其中交流技术。
周五发版
「周五发版」是一个程序梗:一旦版本发布,我们就要开始祈祷一切如期运行。这个模块寓意,所有模型、产品版本更新,都能大吉大利。
Claude Security 公测:Claude 开始帮企业扫代码漏洞
北京时间 5 月 1 日,Claude Security 正式面向 Claude Enterprise 用户开放公测。它可以扫描代码库里的安全漏洞,并基于 Opus 4.7 生成建议修复方案。
根据官方介绍,它支持定时扫描和定向扫描,也能把发现的问题接入审计系统,并追踪已经 triage 过的结果。对企业来说,这意味着安全检查可以从「上线前跑一下工具」变成更持续的代码库体检。
当然,最终修复还是需要人审。它更像是一个会读代码、会解释漏洞、会提 PR 建议的安全工程师助手。
一句话总结:Claude 不只是帮你写代码了,现在还开始帮你挑代码毛病。
Codex CLI 新增 /goal:不达目的不罢休
Codex CLI 0.128.0 新增了 /goal 功能。
简单说,你可以给 Codex 设定一个目标,然后让它在多轮对话里持续记住这个目标,直到任务完成,或者资源预算耗尽。Felipe Coury 把它称为 OpenAI 对 Ralph loop 的一种实现:让 goal 跨 turn 存活,不要一轮对话结束就丢。
这类功能越来越多之后,Coding Agent 就不再像是一次性问答工具,而更像一个可以长期推进任务的工程协作者了。
但只要 Agent 开始「不达目的不罢休」,就必然会牵扯到经济成本。下文的「这周有事」模块里,OpenRouter 官方给出了 GPT-5.5 和 5.4 成本对比报告;
GitHub Copilot 将转向用量计费
GitHub 在 4 月 28 日正式宣布,从 6 月 1 日开始,Copilot 将转向 usage-based billing,也就是基于实际使用量计费。GitHub 官方解释,Copilot 正在支持更多 Agentic 和高级工作流。
其实,这也很好理解。以前 AI 编程工具主要是补全代码,包月订阅还比较容易理解;但当它开始跑长任务、调工具、开 Agent、生成 PR、做大规模修改时,成本结构就完全不一样了。
Claude Platform 推出 keyless auth
Claude Platform 推出了 keyless auth 功能。现在开始,CLI 可以通过浏览器认证,服务器和 CI 等工作负载也可以使用已有的云身份进行认证,你不用到处管理 API Key 了。
keyless auth 的方向很明确:让 AI API 更像成熟云服务,而不是一串到处复制粘贴的密钥。
Qwen-Scope 发布:让模型内部变得更可解释
Qwen 团队发布了 Qwen-Scope,一套面向 Qwen 家族模型的开源稀疏自编码器工具集。它主要用于模型可解释性研究,也可以帮助开发者分析模型内部特征。
它通过在 Qwen 的隐藏层中训练 Sparse Autoencoders,把模型内部的激活拆成更容易理解的特征。官方提到,这类特征可以用于推理控制、数据分类与合成、训练问题追踪、评测样本分析等场景。
Xiaomi MiMo-V2.5 开源:小米继续加码大模型
北京时间 4 月 28 日凌晨,小米 MiMo-V2.5 正式开源。
这次的 MiMo-V2.5 是一个原生全模态模型,支持文本、图片、视频和音频理解,统一架构下具备较强的 Agent 能力。它基于 MiMo-V2-Flash 主干,并加入视觉和音频编码器,官方模型卡显示,其上下文长度最高可达 1M tokens。
此外,同一天小米还上线了 Xiaomi MiMo Orbit 开发者激励计划,面向高质量 AI 开发者定向发放 Token,最高可获得 16 亿 Tokens:
这边开发者忙着申请免费 Token,另一边的闲鱼已经开始闻风而动:
DeepSeek 视觉能力露出端倪
DeepSeek 研究员发了一条非常简短的动态:Now, we see you:
这可能暗示 DeepSeek 即将支持识图功能。此前,V4 主线模型的重点仍在文本、代码和长上下文任务,如果多模态能力跟上,DeepSeek 的产品线会更完整。消息发布 24 小时内,有不少 DeepSeek 用户表示被灰度到该功能,开始测评 DeepSeek 的识图能力。
DeepSeek-V4-Pro 75% API 折扣延期
不知道是不是受小米 MiMo-V2.5 推广活动影响,DeepSeek 官方宣布 V4-Pro 的 API 75% 折扣已经延期到 2026 年 5 月 31 日 15:59 UTC。与此同时,DeepSeek 官方 API 文档还显示,所有模型的输入缓存命中价格已经降至发布价格的 1/10。
HappyHorse 1.0 beta 发布:视频模型又杀出一匹马
Reddit 上有人讨论了一个叫 HappyHorse 1.0 的 AI 视频模型。帖子称,它在匿名视频排行榜上快速冲到文本转视频和图像转视频第一,并在盲测中击败了 Seedance 2.0 和 Kling 3.0。
HappyHorse 不仅能生成视频,还强调视频和音频的一体化处理,并支持多镜头叙事和角色一致性。值得一提的是,据 Reddit 帖子所说,HappyHorse 首席开发者张迪曾是快手副总裁,也是 Kling 早期核心成员之一。
Mistral Medium 3.5 发布,Vibe 支持远程异步 Agent
Mistral 发布了 Mistral Medium 3.5,并把它作为 Le Chat 和 Mistral Vibe 的新默认模型。它是一个 128B dense 模型,支持 256K 上下文,把指令遵循、推理和代码能力合并到一套权重里。
这次值得注意的,不只是模型本身,还有 Vibe remote agents。现在,Mistral Vibe 的 coding session 可以在云端异步运行,多个任务并行推进。你可以从 CLI 或 Le Chat 启动远程 Agent,也可以把本地 CLI 会话 teleport 到云端继续跑。
小纸条:谨防大家不熟悉这个模型,Mistral 模型是由法国人工智能公司 Mistral AI 开发的系列高性能大语言模型(LLM)。
Zed 1.0 发布
Zed 团队宣布,虽然他们已经发布过上千个版本,但以前都还在 0.x 阶段;现在,Zed 终于来到 1.0。
Zed 一直是开发者圈里很受关注的编辑器:速度快、协作体验好,也很早开始拥抱 AI 编程工作流。
开源雷达
Symphony:OpenAI 开源 Codex 编排工具
OpenAI 开源了 Symphony。
Symphony 把项目工作拆成隔离的、自治的实现任务,让团队不再逐个监督 Coding Agent,而是管理工作本身。
官方示例里,Symphony 可以监控 Linear 看板,自动为任务启动 Agent,Agent 完成工作后提供 CI 状态、PR review 反馈、复杂度分析和 walkthrough 视频,最后安全合并 PR。此外,官方提醒,Symphony 目前还只是一个低调的 engineering preview,更适合在可信环境里测试。
简单说,它不是给普通用户用的 AI 编程玩具,而是给团队想象未来软件工程流水线的样板。
地址:github.com/openai/symphony
DeepSeek TUI:跑在终端里的 DeepSeek Coding Agent
DeepSeek TUI 是一个海外友人专门为 DeepSeek 模型打造的终端原生 Coding Agent。
简单说,它有点像 DeepSeek 版的 Codex / Claude Code:可以直接在终端里读取和编辑文件、执行 shell 命令、管理 Git、搜索网页、调用 MCP,还能编排 sub-agent 来一起干活。项目由 Rust 编写而成,安装后是一个独立二进制文件,不依赖 Node.js 或 Python 运行时。
DeepSeek TUI 提供了三种工作模式:Plan、Agent 和 YOLO。Plan 模式偏只读探索,适合先让模型理解项目;Agent 模式会在关键操作前请求确认;YOLO 模式则更激进,适合你愿意让它自动执行的时候。
地址:github.com/Hmbown/DeepSeek-TUI
TradingAgents:多 Agent 金融交易框架
TradingAgents 是一个多 Agent LLM 金融交易框架,基于 LangGraph 构建,支持多个 LLM 提供商,包括 OpenAI、Google、Anthropic、xAI、DeepSeek、Qwen、GLM、OpenRouter、Ollama 和 Azure OpenAI。用户可以在 CLI 中选择股票代码、分析日期、模型提供商、研究深度等参数,然后让一组 Agent 共同完成金融数据分析。
比较有意思的是,它还设计了记忆和恢复机制。每次运行完成后,系统会把决策记录写入本地 memory log。下次分析同一标的时,它会回顾过去的决策、实际收益和经验教训,再把这些内容注入 Portfolio Manager 的提示词里。
地址:github.com/TauricResearch/TradingAgents
Maigret:根据用户名在 3000+ 网站收集线索
Maigret 是一个 OSINT 工具,可以根据用户名,在 3000 多个网站上收集公开账号线索,并生成报告。它支持 CLI、本地安装、Docker 和 Web UI,还可以输出 HTML、PDF、JSON、CSV、TXT、XMind 和交互式图谱。
这不是一个新项目,但在 AI Agent 场景里会变得更有存在感。很多 Agent 做信息收集时,真正缺的不是模型能力,而是稳定、结构化、可复用的信息采集工具。Maigret 这类工具就像 Agent 的「侦察插件」,可以把公开网络中的碎片线索整理成更适合模型读取的材料。
地址:github.com/soxoj/maigret
code-review-graph:给 Claude Code 做本地代码知识图谱
code-review-graph 是一个给 AI 编程助手用的本地代码知识图谱工具。
它会用 Tree-sitter 构建代码结构图,增量追踪代码变化,再通过 MCP 把精确上下文交给 Claude Code、Codex、Cursor 等 AI 工具,让模型只读真正相关的代码。项目介绍中提到,它可以让代码审查场景的 token 消耗降低约 6.8 倍,日常编码任务最高降低约 49 倍。
code-review-graph 主要解决 AI 编程中的成本和效率问题:模型每次都重读整个代码库,太贵,也太慢。先把代码库变成一个可查询的结构地图,之后 AI 做 review、查影响范围、分析 PR 时,就不用把一堆无关文件全塞进上下文里了。
如果说长上下文模型解决的是「我能不能塞进去」,那 code-review-graph 解决的是「我到底该不该塞进去」。
地址:github.com/tirth8205/code-review-graph
Claude Receipts:给 Claude Code 打小票
Claude Receipts 可以通过 Claude Code 的 SessionEnd hook 自动生成会话收据,并支持 HTML、终端 ASCII 和热敏打印机输出。小票里会显示 session 信息、token 明细、模型拆分、总成本和 GitHub 项目二维码。
地址:github.com/chrishutchinson/claude-receipts
VoxCPM2:开源 TTS 也开始卷起来了
清华 OpenBMB 团队开源了 VoxCPM2,一个 20 亿参数的开源 TTS 模型。它使用 200 万小时多语言数据训练,并支持 48kHz 录音级音频。
这类项目值得关注的原因在于,语音生成正在从「能说话」走向「更像人、更可控、更稳定」。
尤其当 Agent 能看、能写、能操作网页之后,下一步自然是能更自然地说话。TTS 模型的质量越高,未来 AI 助手、播客生成、视频旁白、语音客服都会更像真实产品,而不是 Demo。
地址:github.com/OpenBMB/VoxCPM
这周有事
Ghostty 将退出 GitHub
终端模拟器项目 Ghostty 宣布将退出 GitHub 平台。
开发者给出的原因很直接:他们认为 GitHub 在微软治理下变得越来越不稳定,过去一个月几乎天天宕机,严重扰乱开发者工作。Ghostty 项目会在未来几个月公布迁移细节,GitHub 上的仓库将变成只读镜像。
OpenRouter:GPT-5.5 实际成本上涨 49% 到 92%
OpenRouter 发布了一份 GPT-5.5 成本分析。
根据 OpenRouter 的数据,GPT-5.5 相比 GPT-5.4 标价上涨:输入从每百万 token 2.5 美元涨到 5 美元,输出从每百万 token 15 美元涨到 30 美元。
虽然 OpenAI 提到 GPT-5.5 更不啰嗦、长 prompt 下输出更短,但 OpenRouter 观察到,实际成本仍上涨了 49% 到 92%。
有意思的是,长 prompt 场景下,GPT-5.5 的输出确实变短了。OpenRouter 统计显示,当 prompt 超过 10K tokens,GPT-5.5 的 completion tokens 会少 19% 到 34%。但在短 prompt 场景下,成本涨幅反而更明显。
这对开发者的启发很简单:不能只看模型单价,也要看实际任务形态。
如果你的任务是长上下文分析,GPT-5.5 的「更短输出」可能抵消一部分涨价;但如果是短 prompt 高频调用,账单可能会明显变贵。
Bun 开始推进 Zig → Rust porting
Bun 仓库里出现了一个新的 Phase-A porting guide,标题明确写着「Zig → Rust porting guide」。这份文档的目标是指导开发者把一个 Zig 文件翻译成 Rust 文件,Phase A 先在同目录生成一个逻辑忠实的 .rs 草稿,不要求编译;Phase B 再逐个 crate 让它编译通过。
这条消息之所以引人注意,是因为 Bun 一直以 Zig 写成著称。
当然,这并不等于 Bun 已经完全转向 Rust。就这次 commit 来看,它更像是在系统化准备移植流程:如何命名文件、如何处理 crate map、哪些 Rust 依赖不能用、如何保留 Zig 的事件循环和 syscall 设计,都写得非常细。
但无论如何,Bun 开始认真写 Zig 到 Rust 的迁移规范,本身就足够让人议论一番。
OpenAI 模型、Codex 和 Managed Agents 登陆 AWS
OpenAI 和 AWS 扩大合作,OpenAI 模型、Codex 以及由 OpenAI 驱动的 Amazon Bedrock Managed Agents 将进入 AWS 体系,当前为 limited preview。
以前很多企业想用 OpenAI 能力,但基础设施、安全、合规、采购和身份系统都已经在 AWS 里。现在 OpenAI 把 GPT-5.5 等模型放到 Amazon Bedrock,同时让 Codex 可以通过 Bedrock provider 使用,对这些企业来说,部署路径会更顺。
官方还提到,Codex 每周已有超过 400 万人使用。它不仅用于写代码、解释系统、重构应用、生成测试,也开始被用于研究、分析和文档型工作。
一句话总结:OpenAI 正在从「一个独立 AI 平台」变成企业云基础设施里的一部分。
Manus 外资收购被禁止
国家发展改革委官网发布消息,外商投资安全审查工作机制办公室依法依规对外资收购 Manus 项目作出禁止投资决定,要求当事人撤销该收购交易。
在 AI 这样的关键技术领域,跨境并购、技术出海、团队迁移和控制权转移,都会越来越受到合规审查。人民日报评论也指出,这是《外商投资安全审查办法》实施以来,首个公开叫停的 AI 领域外资收购案。
最后,以一张网友针对此次事件做的梗图结束本次回顾,希望你这周的工作顺利和心情愉悦 (⁎⁍̴̛ᴗ⁍̴̛⁎)