还在人肉刷 ArXiv？我用 GitHub Actions + 本地大模型搭建了个 0 成本的“论文雷达”宝藏开源工具，

😫 前言：科研人的“信息过载”危机

作为一名 AI 领域的开发者（炼丹师），每天早上的固定仪式就是打开 ArXiv，看看昨晚 cs.AI 或 cs.LG 又涌现了哪些新工作。

但现在的论文产出速度简直太疯狂了。光是主流分区，每天就有上百篇更新。面对这滚滚而来的 Information Flow，我们通常只有两种选择：

人肉扫读：看标题 -> 猜内容 -> 下 PDF。缺点：累，容易漏，且效率极低。
关键词订阅 (RSS)：订阅 "Agent", "RAG", "Diffusion"。缺点：信噪比极低。你关注 "Agent" 想看智能体，结果推给你一堆“房地产中介 (Real Estate Agent)”的数据分析论文；或者只要文中提了一嘴 "Transformer"，就被抓取进来。

我们在“筛选”上浪费了太多时间，反而没有精力去“精读”了。

最近在 GitHub 逛街时，意外挖到了一个刚开源的宝藏项目：ArXiv Radar。

试用了一周，我愿称之为年度最佳“白嫖”项目。作者的思路非常清奇：利用 GitHub Actions 的免费计算资源，直接运行本地量化大模型（Local LLM），对论文进行语义级的阅读、判别和打分。

今天就来扒一扒这个硬核工具，顺便分享一下我的配置心得。

🚀 为什么说它是“降维打击”？

市面上也有 Connected Papers、AMiner 等工具，但 ArXiv Radar 击中了我几个痛点：

1. 真正的“语义重排” (Semantic Reranking)

这是它与传统 RSS 脚本最大的区别。它不是做 RegEx (正则表达式) 匹配，而是做 Prompt Engineering。

它内置了 llama-cpp-python，会加载一个 3B 大小的量化模型（Llama3.2）。当你输入你的兴趣时，它会像一个不知疲倦的审稿人，阅读每一篇论文的摘要。

场景：我关注“大模型在软件测试中的应用”。
传统工具：只要包含 "Test" 就推送 -> 结果推了一堆 "A/B Testing" 或 "Test Set Evaluation"。
ArXiv Radar：它能识别出这篇论文讲的是 "Math Test" 还是 "Software Unit Test"，只有符合我定义的语义场景，才会给高分。

2. 极致的“白嫖”架构 (Zero Cost)

这点必须给作者点赞。通常我们要跑大模型，要么买 GPU 服务器（贵），要么调 OpenAI API（还是要钱）。

但这个项目完全不需要：

Serverless: 它利用 GitHub Actions 的 Runner 环境。
Local Inference: 模型直接在 Runner 里下载并运行。
Free: 只要你有 GitHub 账号，Fork 一下就能跑，用的全是 GitHub 送的免费额度。

3. “保姆级”日报体验

每天早上，它会把处理好的结果发到邮箱。我不看别的，只看 Score > 80 的那几篇。

而且它自带 中文 TL;DR，扫一眼中文总结，感兴趣再点开 PDF。

🛠️ 3 分钟部署指南

因为是开源项目，没有任何注册门槛。

第一步：Fork 仓库

项目地址：github.com/su-Insight/… 点右上角的 Fork，把它复制到你自己的账号下。

第二步：配置 GitHub Secrets

在你的仓库页面，点击 Settings -> Secrets and variables -> Actions。你需要配置几个必要的“环境变量”，让脚本能发邮件：

ARXIV_QUERY: 你关注的分区，比如 cs.AI+cs.SE (软件工程+人工智能)。
SENDER: 发送邮件的邮箱（建议用小号 QQ 邮箱）。
SENDER_PASSWORD: 邮箱的 SMTP 授权码（不是登录密码哦，去邮箱设置里开一下就有）。
RECEIVER: 你的接收邮箱。

第三步：定义你的“科研替身” (关键！)

点击 Variables 选项卡，添加 RETRIEVER_TARGET。这里是最关键的，你要告诉 AI 你到底想看什么。建议写具体的长难句，不要只写单词。

我的配置示例（亲测好用）：

Large Language Models for automated software testing and debugging
Flaky test detection using machine learning techniques
Root cause analysis in CI/CD pipelines
Autonomous Agents for code generation

这是您要求的这部分内容的 Markdown 源代码，包含排版格式（标题、加粗、引用块等），您可以直接复制衔接在前文后面。

搞定！ 以后每天 UTC 20:00 (北京时间凌晨 4 点)，GitHub 就会自动唤醒这个 Action，帮你干活。

🧠 进阶玩法：如何调教你的 AI 助理？

用了几天后，我发现了一些让推荐更精准的“骚操作”：

1. 善用“负面描述”

虽然项目主要是做正向匹配，但在 RETRIEVER_TARGET 里，你可以尝试加上具体的限制词。比如我只想看架构，不想看单纯的应用，我可以写：

"Focus on model architecture improvements, NOT simple applications on specific datasets."

大模型是能读懂这种指令的。

2. 手动触发测试

刚配置完如果不确定是否成功，可以去 Actions 页面，左边选择 Test-Daily Paper Sender，然后手动点 Run workflow。

这个测试模式会忽略日期限制，直接抓 5 篇论文跑一遍流程，几分钟就能看到邮件效果。

3. 甚至可以换模型 (For 硬核玩家)

如果你觉得 Qwen2.5-3B 不够强，或者你想用特定领域的微调模型。你可以修改代码里的 main.py 或相关配置，把 HuggingFace 的模型地址换掉。只要模型是 GGUF 格式且大小在 3GB 左右（受限于 GitHub Runner 的内存），理论上都能跑！

📝 总结

在 AI 时代，我们不应该再做“数据的奴隶”。

ArXiv Radar 给我的感觉就像是雇了一个免费的、不知疲倦的科研助理。它帮我把 90% 的水文过滤掉，让我把宝贵的精力集中在剩下 10% 真正硬核的 SOTA 上。

如果你也受够了无效的检索，又不想花钱买昂贵的科研工具，强烈建议试试这个项目。

既能学习 GitHub Actions 的自动化部署，又能享受 AI 带来的效率提升，何乐而不为？

🔗 项目传送门：github.com/su-Insight/…