-
DeepSeek:没有做专门的阅读UI,无法读取pdf中的图像,拉。
-
Doubao:有专门的阅读UI,快捷段落解释,有全文翻译。信息足够足,能否提高效率还有待观察。先给到人上人。
-
Qwen:有专门的阅读UI,快捷段落解释,有全文翻译。有导读但是按页来的,不是章节。和以前比感觉变拉了。
-
元宝:有UI,有总结和精读,方便快速了解内容。有全文翻译,但没有快捷段落解释。提示词分章节介绍准备和Doubao一样,并且它的回答能够包含图像,可惜图像给出的位置并不正确。人上人。
-
NotebookLM:拉完了!!!
-
Sholarcy:拉完了!!!
-
Gemini和Grok:都是纯文字回答,无专门设计。
-
GPT:无UI和专业设计,但考虑到它是LLM SOTA,有待进一步探索。NPC
-
Alphaxiv:没有快捷解释,但会生成Blog,并且对接多个LLM(GPT5,Grok,Gemini、Kimi、Claude等),实测Gemini2.5 pro、Claude 4.5 sonnet效果好;该网页的可读性强。人上人。
总结:至此,有了3个人上人,Doubao、元宝、Alphaxiv
具体对比
Dooubao
功能较为完备,就是没有导读。
元宝
回答清晰,有图表(不正确),UI一般,同时看原文、翻译、提问时,可读性较差。
Alphaxiv
有导读,没有翻译、快捷解释,但能选择多个国外模型,页面是最好看的。
总结
元宝和Alphaxiv的导读/Blog能帮助我快速了解论文,prompt的逐章节讲解能让我明白论文具体讲什么,优先使用Alphaxiv,因为它对接国外模型,Blog质量高,如果做PPT,则需要元宝+Alphaxiv。
豆包功能全面,但体验上总觉得差一点,没有自动生成的导读,全文翻译排版丑,UI界面丑,当然元宝也丑。
目前AI辅读paper pipline:生成逐章节讲解和概述(Blog),通过Blog了解,再通过逐章节泛读,没看懂精读论文对应地方,不确定看没看懂扫一遍论文中文版。
最终形式为readpaper + Alphaxiv。