AI 辅助看论文,从夯到拉

65 阅读2分钟
  • DeepSeek:没有做专门的阅读UI,无法读取pdf中的图像,拉。

  • Doubao:有专门的阅读UI,快捷段落解释,有全文翻译。信息足够足,能否提高效率还有待观察。先给到人上人。

  • Qwen:有专门的阅读UI,快捷段落解释,有全文翻译。有导读但是按页来的,不是章节。和以前比感觉变拉了。

  • 元宝:有UI,有总结和精读,方便快速了解内容。有全文翻译,但没有快捷段落解释。提示词分章节介绍准备和Doubao一样,并且它的回答能够包含图像,可惜图像给出的位置并不正确。人上人。

  • NotebookLM:拉完了!!!

  • Sholarcy:拉完了!!!

  • Gemini和Grok:都是纯文字回答,无专门设计。

  • GPT:无UI和专业设计,但考虑到它是LLM SOTA,有待进一步探索。NPC

  • Alphaxiv:没有快捷解释,但会生成Blog,并且对接多个LLM(GPT5,Grok,Gemini、Kimi、Claude等),实测Gemini2.5 pro、Claude 4.5 sonnet效果好;该网页的可读性强。人上人。

总结:至此,有了3个人上人,Doubao、元宝、Alphaxiv

具体对比

Dooubao

功能较为完备,就是没有导读。

元宝

回答清晰,有图表(不正确),UI一般,同时看原文、翻译、提问时,可读性较差。

Alphaxiv

有导读,没有翻译、快捷解释,但能选择多个国外模型,页面是最好看的。

总结

元宝和Alphaxiv的导读/Blog能帮助我快速了解论文,prompt的逐章节讲解能让我明白论文具体讲什么,优先使用Alphaxiv,因为它对接国外模型,Blog质量高,如果做PPT,则需要元宝+Alphaxiv。

豆包功能全面,但体验上总觉得差一点,没有自动生成的导读,全文翻译排版丑,UI界面丑,当然元宝也丑。

目前AI辅读paper pipline:生成逐章节讲解和概述(Blog),通过Blog了解,再通过逐章节泛读,没看懂精读论文对应地方,不确定看没看懂扫一遍论文中文版。

最终形式为readpaper + Alphaxiv。