推荐8个本周GitHub上最火火火的开源神器，收藏一波本周 Trending 的画风很整齐，一半都是 AI Agent

本周 Trending 的画风很整齐，一半都是 AI Agent 相关的工具和框架。从给 Claude Code 加长期记忆，到把想法变成 PR的自动化工作流，再到面向金融市场的基础模型，这批项目放一起看，能明显感觉出 AI 编码这一年已经从能写代码卷到怎么把编码过程本身工程化了。

挑了 8 个本周最值得看的，按 Star 增速和话题性排了个顺序，收藏慢慢看。

给 AI 编程助手装上一整套开发方法论，让它不再一上来就写代码

https://github.com/obra/superpowers

本周热度第一梯队，单周新增 Star 数飙得厉害。Superpowers 是一套面向编程 Agent 的技能框架，本质上是在 Claude Code、Cursor、Codex 这些 AI 编程工具外面套了一层 SOP。

传统体验是你丢一句需求，AI 立刻开干；Superpowers 强制它先做七件事：头脑风暴澄清需求、拉 Git Worktree 开隔离分支、写拆解到 2-5 分钟粒度的实现计划、派子 Agent 执行、强制 TDD 的红绿循环、跑代码评审、最后收尾合并。每一步都有对应的 skill 自动触发，用户不用手动切档。

作者 Jesse Vincent 在博客里讲得很直白——AI 编程最大的问题不是能力，是它喜欢跳步骤。系统化永远优于临时起意，证据永远优于嘴上说，这是整套框架的核心。

适合已经在日常用 AI 编程助手、但经常被它改着改着就偏了坑过的人。支持 Claude Code、Cursor、Codex CLI、Copilot CLI、Gemini CLI 一整套，插件市场一行命令就能装。

详细介绍：15 万Star的AI编码神技，让Claude Code干8 小时不偏题

给 Claude Code 装长期记忆，跨会话不失忆

https://github.com/thedotmack/claude-mem

用过 Claude Code 的人都知道它有个毛病——每次新开会话就像失忆了一遍，之前讲过的项目架构、踩过的坑、定下的风格规范，全得重新复述一次。Claude-Mem 就是来解决这件事的。

做法很聪明：挂了 6 个生命周期 Hook，在会话开始、用户输入、工具调用后、会话结束这些关键节点自动捕获上下文，然后用 Claude 自己的 agent-sdk 压缩归档，存到本地 SQLite + Chroma 向量库。下次打开 Claude Code，相关记忆会被自动注入回上下文。

最狠的是那套三层搜索协议：先用 search 拿紧凑索引（50-100 tokens 一条），再用 timeline 拿上下文时间线，最后按需用 get_observations 拉完整细节。这个渐进式披露的设计能省下约 10 倍 token，对重度用户来说一个月能省出一部手机。

一行命令装完：npx claude-mem install。还自带一个本地 Web 查看器（localhost:37777），能实时看到记忆流是怎么积累的。支持 Gemini CLI、OpenCode、OpenClaw 等多端。

协议 AGPL-3.0，TypeScript 为主，已经更到 v12.2.0 这种迭代速度。重度 AI 编程用户建议直接装上。

让 AI 编码像 CI 流水线一样可重复

https://github.com/coleam00/Archon

Archon 的定位很有意思——作者把它类比成AI 编码届的 Dockerfile + GitHub Actions，目标是把 AI 写代码这件事从玄学变成确定性流程。

你用 YAML 定义一条工作流：plan → implement → run-tests → review → create-pr，每个节点可以是 bash 命令、测试脚本，也可以是 AI 节点（规划、生成、评审）。启动后每次运行都会在独立 Git worktree 里跑，多条流水线互不干扰，跑完一个 PR 就自动出来了。

内置了 17 个默认工作流，覆盖从修一个 GitHub Issue、到想法直接到 PR、再到多代理并行做 PR 审查的常见场景。接入 Slack、Telegram、Discord、GitHub Webhook 都是 5-15 分钟搞定。

作者 Cole Medin 之前做过基于 Python + RAG 的旧版 Archon，这次 v2 彻底重写成 TypeScript + YAML 引擎，思路从Agent 管理台变成了Agent 工作流编译器，方向明显更工程化了。

协议 MIT，TypeScript 占 98%，最新版本 v0.3.6。适合团队化使用 AI 编码、希望把 AI 怎么干活沉淀成可复用资产的场景。

面壁智能开源的 TTS 模型，支持 30 种语言，还能用文字描述设计一个声音

https://github.com/OpenBMB/VoxCPM

本周语音方向最亮眼的项目。面壁智能联合清华 THUHCSI 开源的 2B 参数 TTS 模型，架构上选了条相对冷门的路——Tokenizer-Free 的扩散自回归，直接生成连续语音表征，跳过离散 tokenization 这一步，号称能保留更多的韵律细节。

四种玩法都挺好理解：

普通文本转语音：丢文本出音频
Voice Design：用自然语言描述一个温柔的年轻女性声音、语速偏慢，直接生成对应音色，不需要参考音频
可控克隆：给一段短参考音频，复刻音色再加风格引导
极致克隆：参考音频 + 文本一起给，完整还原音色、节奏、情绪

训练数据用了超过 200 万小时的多语言数据，输出是 48kHz 录音室级音频。除了 30 种主要语言，还支持粤语、四川话、陕西话、闽南话这些中文方言，对做自媒体、配音、本地化的团队很友好。

协议 Apache-2.0，可商用，RTX 4090 上实测 RTF 约 0.3，上 vLLM 加速能压到 0.13，基本能做实时流式。

微软这个 Markdown 转换器，把 PDF/Word/Excel/PPT 全拍扁

https://github.com/microsoft/markitdown

看着不性感，但属于每个做大模型应用的人都该收藏的基础设施。MarkItDown 是微软开源的 Python 工具，把各种奇怪格式的文件统一转成 Markdown 喂给 LLM。

支持的格式非常全：PDF、Word、Excel、PPT、HTML、CSV、JSON、XML、ZIP、EPub、音频（含语音转录）、图片（含 OCR 和 EXIF）、YouTube 视频（抓字幕）、Outlook 邮件。选 Markdown 是因为它对 LLM 最友好，能保留结构，token 效率又比 HTML 高一大截。

从数据工程师的角度看，这个项目填了一个蛮刚需的空——企业内部做 RAG 知识库最烦的就是各种格式的文档清洗，之前要拼 pypdf、python-docx、openpyxl、BeautifulSoup 一堆库，现在 pip install 'markitdown[all]' 一行搞定，还自带 MCP Server 可以直接接 Claude Desktop。

最新版本 v0.1.5，接口已经升级到了流式处理（直接读二进制流，不再生成临时文件），大文件处理效率比以前好不少。

协议 MIT，Python 99.7%，热度持续在线。

金融市场也开始有自己的基础模型了

https://github.com/shiyu-coder/Kronos

Kronos 是国内团队做的、首个面向金融市场的开源基础模型。和常见的通用时序预测基础模型（TSFM）不同，这个直接针对 K 线这种金融市场语言做预训练，数据来自全球 45+ 家交易所。

架构是两阶段的：先用一个专用 Tokenizer 把连续多维 K 线量化成分层离散 token，再上 Decoder-only 的自回归 Transformer 做预训练。思路上其实很像 NLP 的 BERT/GPT 套路，只是把词换成了 K 线片段。

开源了三档模型：mini（4.1M）、small（24.7M）、base（102.3M），另有 499.2M 的 large 未开源。支持概率预测、多路径采样、批量预测，还给了完整的微调和 Qlib 回测 Pipeline，上手难度并不高。

作者本人也说得很清楚：开源的微调示例是演示级别，不是生产级量化系统，想真实用要自己加组合优化、风险因子、交易成本建模这些东西。

论文 arXiv:2508.02739，已经被 AAAI 2026 接收。在线 Demo 可以看 BTC/USDT 24 小时预测。协议 MIT，Python 为主。

从数据工程师的视角多说一句：这类模型真正的价值不在于预测准不准，而在于它把金融时序数据的表征学习向前推了一步，下游接风控、异常检测、策略因子都能借上力。

13 位投资大师 + 6 个功能智能体，搭一个虚拟对冲基金

https://github.com/virattt/ai-hedge-fund

话题性最强的一个。19 个 Agent 组团的 AI 对冲基金项目，里面 13 个智能体分别模拟了巴菲特、芒格、本·格雷厄姆、迈克尔·伯瑞、彼得·林奇、凯茜·伍德、比尔·阿克曼、纳西姆·塔勒布、斯坦利·德鲁肯米勒等一串响当当的名字。

运行时每个投资大师按自己的风格分析同一批股票：价值派找安全边际，成长派找颠覆性机会，宏观派找非对称机会，黑天鹅派盯尾部风险。然后由估值、情绪、基本面、技术、风险管理、组合经理这 6 个功能 Agent 把信号汇总，给出最终的模拟交易决策。

一行命令就能跑起来：

poetry run python src/main.py --ticker AAPL,MSFT,NVDA

支持用 OpenAI、Anthropic、Groq、DeepSeek，也能走 Ollama 跑本地模型。还带回测（backtester.py）和 Web 应用版。

作者在 README 第一段就写了大字免责：仅用于教育和研究，不执行真实交易。所以别把它当开源量化系统，就当一个看 Multi-Agent 协作怎么设计的优秀样本——Python 60% + TypeScript 36% 的全栈结构，有 LangGraph/LangChain 的影子，做 Agent 应用的同学照着读一遍代码就能学到很多。协议 MIT。

上海交大开源的《动手学大模型》，11 章安全向教程

https://github.com/Lordog/dive-into-llms

由上海交大两门课的讲义扩展而成的公益教程，张倬胜老师主讲。最大的差异化不在微调怎么做，而在把大模型安全放到了很重的位置。

11 个章节每章都配课件 PDF、README 教程、Jupyter 脚本三件套：

能用

：微调部署、提示学习、思维链
用好

：知识编辑、数学推理、多模态、GUI 智能体
用得安全

：模型水印、隐写、越狱攻击、智能体安全、RLHF 对齐

安全这一块是项目的独特价值——大部分 LLM 教程讲到微调和 RAG 就停了，Dive into LLMs 把水印、越狱攻击、RLHF 对齐这些课题都给了完整实验。这对做校园科研、或者需要向上汇报"我们对 AI 安全做了什么"的同学特别有用。

最近还联合华为昇腾社区出了《大模型开发全流程》国产化版本，分初级/中级/高级三档，有 PPT、实验手册、视频。

主要是 Jupyter Notebook，中文教程，免费公益。学生党和刚入门大模型的同学直接 Star 收藏。

这一波 Trending 看下来，AI 编码已经进入下一阶段。去年大家还在比谁的 AI 写代码更准，今年热度最高的项目都在解决一个更工程化的问题——怎么让 AI 写代码这件事本身变得可管理、可复用、可审计。Superpowers 给方法论，Claude-Mem 给记忆层，Archon 给流水线，三个组合起来基本是个完整的 AI 编程操作系统。

另一条明线是大模型基础设施下沉。MarkItDown 把文档预处理标准化，Kronos 把时序表征做向量化，VoxCPM 把语音生成做产品化，都是那种看着不炫、但越往后用会发现越重要的轮子。

本周个人想试一下的三个：Claude-Mem（已经被失忆问题折磨很久了）、MarkItDown（正好内部有批 PPT 要转 Markdown 喂 RAG）、Kronos（数据工程师角度对 K 线 Token 化很好奇）。

下周榜单见。

关注程序员腾哥

GitHub 每日挖矿员，每天一个值得收藏的开源项目。AI 工具、开发者效率神器、大厂开源、有趣的脑洞项目。