给 Claude Desktop / Cursor 配置MinerU MCP Server,对它说"帮我读取这个 PDF",它就调用 MinerU 解析。
MinerU 是什么
MinerU 是上海人工智能实验室开源的文档解析工具,可以把 PDF、Word、PPT、图片转换成 Markdown、JSON 等结构化格式。
最近团队发布了 MinerU2.5-Pro(2026年4月),在 OmniDocBench v1.6 基准上拿到了 95.69 分,刷新生态最好成绩。更难得的是,这个成绩是在 1.2B 参数小体量下达成的,参数量不到同类方案的 1/200,纯靠数据工程驱动。
MinerU 的核心能力:
| 能力 | 说明 |
|---|---|
| 版面分析 | 多栏识别、阅读顺序、页眉页脚过滤 |
| 文本识别 | 109 种语言 OCR |
| 公式识别 | 复杂数学公式转 LaTeX |
| 表格提取 | PDF 表格结构化输出 |
| 图片处理 | 图表、嵌入图像、内容保留 |
没有 GPU?没关系,MinerU 提供云端 API(mineru.net),不用自己部署,直接调用。MCP Server 让 AI 助手直接调用 MinerU,零配置实现"对话即解析"。
什么是 MCP
MCP(Model Context Protocol)是 AI 助手调用外部工具的标准协议。配置好后,Claude/Cursor 等 MCP 兼容的 AI 客户端就能直接调用 MinerU 解析 PDF。
最快启动:uvx(无需安装)
只要你的电脑装了 uv(Python 包管理器),就能直接跑,不需要单独安装 MCP Server:
uvx mineru-open-mcp
这条命令会启动 MCP Server,后续在 AI 客户端里配置连接方式即可。
配置 AI 客户端
Claude Desktop(stdio 模式,推荐)
编辑配置文件:
- macOS:
~/Library/Application Support/Claude/claude_desktop_config.json - Windows:
%APPDATA%\Claude\claude_desktop_config.json
{
"mcpServers": {
"mineru": {
"command": "uvx",
"args": ["mineru-open-mcp"],
"env": {
"MINERU_API_TOKEN": "你的token"
}
}
}
}
重启 Claude Desktop,即可使用。
Cursor(stdio 模式)
编辑:~/.cursor/mcp.json(macOS)或 %USERPROFILE%\.cursor\mcp.json(Windows):
{
"mcpServers": {
"mineru": {
"command": "uvx",
"args": ["mineru-open-mcp"],
"env": {
"MINERU_API_TOKEN": "你的token"
}
}
}
}
Windsurf(stdio 模式)
配置文件:~/.windsurf/mcp.json
{
"mcpServers": {
"mineru": {
"command": "uvx",
"args": ["mineru-open-mcp"],
"env": {
"MINERU_API_TOKEN": "你的token"
}
}
}
}
streamable-http 模式(需要自己部署 Server)
启动 Server
MINERU_API_TOKEN=你的token mineru-open-mcp --transport streamable-http --port 8001
客户端配置
{
"mcpServers": {
"mineru": {
"type": "streamableHttp",
"url": "http://127.0.0.1:8001/mcp"
}
}
}
这种模式适合:多个 AI 客户端共享一个 MCP Server,或者需要远程调用时使用。
Flash 模式 vs 精准模式
| Flash(免登录) | 精准(需要 Token) | |
|---|---|---|
| 身份验证 | 无需 Token | 需要 MINERU_API_TOKEN |
| 文件限制 | 20 页 / 10 MB | 600 页 / 200 MB |
| 输出格式 | 仅 Markdown | Markdown + Word + HTML + LaTeX |
| 适用场景 | 快速预览 | 正式使用 |
配置了 MINERU_API_TOKEN 环境变量后,自动切换到精准模式。
可用工具
配置成功后,你可以在 AI 对话中直接调用:
parse_documents
解析本地文件或远程 URL:
请帮我读取 /path/to/document.pdf 的内容
请提取 https://example.com/paper.pdf 的主要内容
支持格式:PDF、DOCX、PPTX、JPG、PNG、HTML。
get_ocr_languages
查询 MinerU 支持的 OCR 语言:
MinerU 支持哪些语言的 OCR?
环境变量说明
| 变量 | 说明 | 默认值 |
|---|---|---|
MINERU_API_TOKEN | API Token,精准模式必需 | —(Flash 模式可选) |
OUTPUT_DIR | 解析结果保存目录 | ~/mineru-downloads |
ENABLE_LOG | 开启日志 | false |
MINERU_LOG_DIR | 日志目录 | ~/.mineru-open-mcp/logs/ |
进阶:日志调试
开启日志:
{
"mcpServers": {
"mineru": {
"command": "uvx",
"args": ["mineru-open-mcp"],
"env": {
"MINERU_API_TOKEN": "你的token",
"ENABLE_LOG": "true",
"MINERU_LOG_DIR": "/Users/you/mineru-logs"
}
}
}
}
日志文件位置:~/.mineru-open-mcp/logs/log_<timestamp>.txt
相关链接
- MCP Server 完整文档:github.com/opendatalab…
- MCP 协议说明:modelcontextprotocol.io
- Token 申请:mineru.net/apiManage/t…