一、Office 文档全格式支持同步就绪
此次更新,MinerU SaaS 端完成了Office 全格式原生解析的适配,无需中间转化,拖入Office文档,即可实现端到端内容提取,速度更快,解析更丝滑:
✅ Word(.docx/.doc):精准提取段落、标题、表格等各类元素
✅ PPT(.pptx/.ppt):幻灯片内容逐页清晰还原
✅ Excel(.xlsx/.xls):表格结构完整保留,支持跨页表格自动合并
✅ PDF / 图片:保持原有解析流程,MinerU / MinerU VLM 双引擎自选
二、MinerU在线版完成最新模型适配
4月底,MinerU 3.0/3.1系列开源项目已经支持 MinerU 2.5-Pro 模型本地部署使用。(点击了解:干货满满丨MinerU 3.0 系列更新:一次不止于模型的全面进化)
最新的 MinerU SaaS端(客户端、网页端、API)也完成了 MinerU 2.5-Pro模型的适配,不用下载,不用部署,不用配环境——打开浏览器,就能拥有更丝滑、更准确的文档解析体验。
👉 立即体验 MinerU :mineru.net/
三、MinerU 2.5-Pro能力展示
1.2B 参数,不改模型结构,只换数据。MinerU 2.5-Pro模型 在 OmniDocBench v1.6评测集上综合跑出 95.69 分,力压各类模型,登顶文档解析 SOTA,着实亮眼。
更关键的是,MinerU 2.5-Pro 性能是真的强,直接上图展示:
1. 印刷体公式、手写体公式都干净输出标准 LaTeX:
2. 手写体文字、竖排/垂直印刷文字,都能高精度提取:
3. 表格解析能力进一步加强:不管是带背景线条干扰、空白单元格,还是嵌入了公式、或者插入多张小图片的复杂表格,表格结构依然准确还原,信息精准提取:
4. 被跨页、换行截断的不完整段落、表格,也能自动拼接合并成完整内容:
5. 除了基础解析能力之外,MinerU 2.5-Pro 还附带一定的图片理解能力:
纸上读来的评测分数,不如亲手测一次来得直观。打开 MinerU,上传你最棘手的那份文档,看看 SOTA 级别的解析到底长什么样。
👉 立即体验 MinerU :mineru.net/