用 DeekSeek 分析了 ICLR 2025/2026 的 论文集,我居然发现。。

160 阅读2分钟

最近 ICLR 吃瓜不断,前一阵子听说有 Review 用 LLM 生成了 40 个评审意见,今天有听说有 xx% 的评审意见被发现时使用 LLM 生成的。虽然大家都讨厌 LLM 生成的评审意见,但是不可否认的是,在个人知识的输入与输出上,LLM 都能帮助我们大幅提效。今天的重点就是前者,用 LLM 高效地提取知识,从而获得洞见。后者如编程/写作,以后会在单开文章再聊。

这里我用 DeekSeek 分析了 ICLR 2025/2026 的 论文集,共 3704 + 1798 = 5502 篇。因为 ICLR 尚未正式接收,这里用的 Review 均分大于 6 分的文章。DeekSeek api 共花费了 18 块人民币。相比起来概览几千篇文献所需要花费的时间与精力,这类分析并没有我预想中的那么费钱,不知道你们是否有同样的感觉。这也给我打开了新思路,以后我会尝试用不同的 prompt,批量提取不同内容的信息,实现快速获取洞见的目的。

项目地址如下,这里只放图和主要结论,细节可以参考:

github.com/QingGo/iclr…

如果觉得项目还不错麻烦帮忙点个星星,十分感谢~

先说结论

  • 研究重心从“单一模型/算法扩展”逐步转向“评测体系、推理能力与训练流程优化”,效率优化仍为长期主线;
    • 强化学习占比从 7.0% 提升到 14.1%,关注度明显上升;benchmark 占比从 4.8% 提升到 7.4%
  • 强化学习相关主题在 2026 论文集(2025年下半年投稿)显著抬头,可能与复杂任务的规划/交互能力需求增加有关;
  • 评测与基准的重要性持续上升,提示社区对“可比性、可复现性与稳健性”的关注增强;
  • 建议:
    • 在方法设计上兼顾效率与流程(例如两阶段训练、统一框架与迭代改进),并强化对基准与零样本泛化的评估;
    • 针对 LLM 的“推理+强化学习”结合方向值得进一步投入,关注采样与大规模数据处理的工程可行性。

数据展示

2025 年度

  • 关键词云图:

  • 关键词 Top20:

  • 优化点 Top20:

2026 年度

  • 关键词云图:

  • 关键词 Top20:

  • 优化点 Top20: