大家好!👋
我开源了一个名为 LocalScholar-Flow 的工具。作为一个科研党,我受够了把 PDF 复制到翻译软件后公式丢失、换行错乱的痛苦,也不想把未发表的论文上传到云端。
于是,我基于开源界最强的 PDF 解析工具和翻译模型,搓了这个完全本地化的自动化工作流。
👀 效果展示 (有图有真相):
1. 强大的 PDF 解析 (基于 MinerU) 它不是简单的 OCR,而是能理解文档结构。看下面的对比图,复杂的双栏排版和图片都被完美提取为 Markdown。
2. 专业的学术翻译 (基于腾讯混元 HY-MT)
翻译后,LaTeX 公式完美保留,学术术语准确。
✨ 核心痛点解决:
- 🔒 隐私第一:所有模型都在本地 GPU 运行(支持 vLLM 加速),断网也能用,数据不出门。
- 🐳 Docker 部署:为了解决环境配置难的问题,我把所有服务(MongoDB, MinerU, API)都封装进了 Docker。
- 🚀 极速上手:
- 运行脚本自动下载模型(国内默认使用 ModelScope 源,速度飞快)。
docker compose up -d启动服务。- 把 PDF 丢进去,自动吐出翻译好的 Markdown。
- 💾 断点续传:内置状态管理,批量跑几十篇论文也不怕中途报错,随时继续。
🔗 项目地址 (GitHub): 👉 github.com/littleBu021…
如果你觉得这个工具对你的科研有帮助,欢迎来 GitHub 点个 ⭐ Star 支持一下!