一天一个开源项目（第65篇）：AI-Researcher - 自动化科学研究的终极利器由港大 (HKU) 团队开发的 A

引言

“科学发现的未来，在于人机协同的智能演进。”

这是“一天一个开源项目”系列的第65篇文章。今天带你了解的项目是 AI-Researcher。

传统的科研工作往往意味着数月甚至数年的文献查阅、代码调试和论文撰写。由香港大学数据科学实验室（HKUDS）开发的 AI-Researcher 正试图打破这一瓶颈。它不仅能帮你搜集资料，还能像一个资深的博士生一样，自主提出研究想法、编写实验代码，并最终生成高质量的学术论文。

你将学到什么

AI-Researcher 如何实现端到端的科研自动化
项目的核心架构与技术栈（Docker 隔离、LiteLLM 集成）
科学研究 Agent 的核心功能模块
如何利用 AI-Researcher 快速验证科研点子
它与 GPT-Researcher 等传统调研工具的区别

前置知识

了解基本的大语言模型（LLM）概念
熟悉 Python 基础环境配置
对学术研究流程（文献综述、实验、论文撰写）有基本认知

项目背景

项目简介

AI-Researcher 是一个旨在自动化整个科学研究生命周期的自主系统。与仅限于信息检索的 AI 助手不同，它构建了一个闭环系统：从生成新颖的研究方向，到在安全的 Docker 容器中执行实验代码，再到利用专属的 Writer Agent 生成 LaTeX 格式的学术手稿。

作者/团队介绍

团队: 香港大学数据科学实验室 (HKUDS Lab)
核心成员: Jiabin Tang, Lianghao Xia, Chao Huang 等
项目亮点: 该项目相关论文已被接收为 NeurIPS 2025 Spotlight 论文，标志着其在人工智能学术界的顶级认可。

项目数据

⭐ GitHub Stars: 15k+
🍴 Forks: 600+
📦 版本: Latest
📄 License: Apache-2.0
🌐 官网: github.com/HKUDS/AI-Re…

主要功能

核心作用

AI-Researcher 的核心作用是将“研究想法”转化为“科研产出”。它通过多 Agent 协作，完成了从文献检索到实验验证再到成果总结的全过程。

使用场景

科研立项前的快速验证
- 在投入大量时间调研前，利用 AI-Researcher 快速跑通初步实验，验证想法的可行性。
文献综述自动生成
- 快速梳理特定领域的最新进展，并识别当前研究的空白点。
算法原型开发
- 将论文中的数学公式自动转化为可执行的 Python 代码并进行基准测试。
辅助撰写学术草稿
- 自动生成包含实验图表、表格和引用的 LaTeX 论文初稿。

快速开始

准备工作：确保已安装 uv (推荐) 和 Docker。

# 1. 克隆并进入目录
git clone https://github.com/HKUDS/AI-Researcher.git
cd AI-Researcher

# 2. 创建环境并安装依赖 (使用 uv 极速安装)
uv venv --python 3.11 && source .venv/bin/activate
uv pip install -e . && playwright install

# 3. 配置环境变量
cp .env.template .env
# 在 .env 中填入你的 OPENAI_API_KEY 或其他模型 Key

# 4. 启动 Web 界面
python web_ai_researcher.py

核心特性

多级交互模式：支持从具体的 Idea 描述入手，也支持仅通过参考论文激发灵感。
自主工程能力：能自动配置环境、编写代码并在 Docker 中安全运行实验。
闭环反馈机制：Agent 会根据实验结果自动分析失败原因或优化算法性能。
高质量论文生成：内置专门的 Writer Agent，生成遵循学术规范的多章节 PDF/LaTeX 文档。
模型兼容性强：基于 LiteLLM，支持 Claude 3.5, GPT-4, DeepSeek 等多种主流模型。

项目优势

对比项	AI-Researcher (HKUDS)	GPT-Researcher (通用版)
最终产出	全套代码 + 学术论文 (PDF/LaTeX)	Markdown 调研报告
核心能力	代码执行与实验验证	信息整合与总结
创新性	能够提出并验证新算法	整理已有的网络信息
环境依赖	需要 Docker 隔离执行环境	主要是网络搜索 API

为什么选择这个项目？

工程落地：它不只是“会说话”，它真的“会写代码”且“敢跑实验”。
学术标准：生成的论文结构严谨，符合顶会/期刊的审美与逻辑。
自由度高：通过闭环反馈机制，它表现出极强的故障排查和自我优化能力。

项目详细剖析

架构设计：多 Agent 协作流程

AI-Researcher 的成功源于其高度解耦的 Agent 架构：

1. Idea Agent (灵感引擎)

根据用户输入的种子（Seed）或参考论文，利用思维链（CoT）生成具有新颖性和可行性的研究方案。它会评估方案的学术贡献点。

2. Engineering Agent (代码与构建)

这是项目最具特色的部分。它负责：

自动生成实验脚本。
在 Docker 容器中拉起虚拟环境。
执行 python main.py 并捕获标准输出和指标。
自我纠错：如果代码报错，它会读取 Error 日志并重写代码。

3. Validator Agent (结果审核)

分析实验产出的 results.json 或日志文件，对比基准数据，判断该研究方向是否达到了预期效果，为后续的论文撰写提供数据支撑。

4. Writer Agent (论文创作)

基于 LaTeX 模板，将研究背景、方法论、实验数据和结论串联起来。它能自动处理 BibTeX 引用，确保证据与结论的逻辑链条完整。

项目地址与资源

官方资源

🌟 GitHub: github.com/HKUDS/AI-Re…
📚 文档: GitHub README
💬 研究机构: HKUDS Laboratory

适用人群

在校大学生与研究生：加速开题调研和实验对比阶段。
AI 实验室研究员：快速探索非核心领域的点子。
独立开发者/科学家：以极低的人力成本探索复杂的算法实现。

欢迎来我中的个人主页找到更多有用的知识和有趣的产品