MCP 服务器配置:让 AI 助手直接解析 PDF 文档

23 阅读3分钟

给 Claude Desktop / Cursor 配置MinerU MCP Server,对它说"帮我读取这个 PDF",它就调用 MinerU 解析。


MinerU 是什么

MinerU 是上海人工智能实验室开源的文档解析工具,可以把 PDF、Word、PPT、图片转换成 Markdown、JSON 等结构化格式。

最近团队发布了 MinerU2.5-Pro(2026年4月),在 OmniDocBench v1.6 基准上拿到了 95.69 分,刷新生态最好成绩。更难得的是,这个成绩是在 1.2B 参数小体量下达成的,参数量不到同类方案的 1/200,纯靠数据工程驱动。

MinerU 的核心能力:

能力说明
版面分析多栏识别、阅读顺序、页眉页脚过滤
文本识别109 种语言 OCR
公式识别复杂数学公式转 LaTeX
表格提取PDF 表格结构化输出
图片处理图表、嵌入图像、内容保留

没有 GPU?没关系,MinerU 提供云端 API(mineru.net),不用自己部署,直接调用。MCP Server 让 AI 助手直接调用 MinerU,零配置实现"对话即解析"。


什么是 MCP

MCP(Model Context Protocol)是 AI 助手调用外部工具的标准协议。配置好后,Claude/Cursor 等 MCP 兼容的 AI 客户端就能直接调用 MinerU 解析 PDF。


最快启动:uvx(无需安装)

只要你的电脑装了 uv(Python 包管理器),就能直接跑,不需要单独安装 MCP Server:

uvx mineru-open-mcp

这条命令会启动 MCP Server,后续在 AI 客户端里配置连接方式即可。


配置 AI 客户端

Claude Desktop(stdio 模式,推荐)

编辑配置文件:

  • macOS~/Library/Application Support/Claude/claude_desktop_config.json
  • Windows%APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "mineru": {
      "command": "uvx",
      "args": ["mineru-open-mcp"],
      "env": {
        "MINERU_API_TOKEN": "你的token"
      }
    }
  }
}

重启 Claude Desktop,即可使用。

Cursor(stdio 模式)

编辑:~/.cursor/mcp.json(macOS)或 %USERPROFILE%\.cursor\mcp.json(Windows):

{
  "mcpServers": {
    "mineru": {
      "command": "uvx",
      "args": ["mineru-open-mcp"],
      "env": {
        "MINERU_API_TOKEN": "你的token"
      }
    }
  }
}

Windsurf(stdio 模式)

配置文件:~/.windsurf/mcp.json

{
  "mcpServers": {
    "mineru": {
      "command": "uvx",
      "args": ["mineru-open-mcp"],
      "env": {
        "MINERU_API_TOKEN": "你的token"
      }
    }
  }
}

streamable-http 模式(需要自己部署 Server)

启动 Server

MINERU_API_TOKEN=你的token mineru-open-mcp --transport streamable-http --port 8001

客户端配置

{
  "mcpServers": {
    "mineru": {
      "type": "streamableHttp",
      "url": "http://127.0.0.1:8001/mcp"
    }
  }
}

这种模式适合:多个 AI 客户端共享一个 MCP Server,或者需要远程调用时使用。


Flash 模式 vs 精准模式

Flash(免登录)精准(需要 Token)
身份验证无需 Token需要 MINERU_API_TOKEN
文件限制20 页 / 10 MB600 页 / 200 MB
输出格式仅 MarkdownMarkdown + Word + HTML + LaTeX
适用场景快速预览正式使用

配置了 MINERU_API_TOKEN 环境变量后,自动切换到精准模式。


可用工具

配置成功后,你可以在 AI 对话中直接调用:

parse_documents

解析本地文件或远程 URL:

请帮我读取 /path/to/document.pdf 的内容
请提取 https://example.com/paper.pdf 的主要内容

支持格式:PDF、DOCX、PPTX、JPG、PNG、HTML。

get_ocr_languages

查询 MinerU 支持的 OCR 语言:

MinerU 支持哪些语言的 OCR?

环境变量说明

变量说明默认值
MINERU_API_TOKENAPI Token,精准模式必需—(Flash 模式可选)
OUTPUT_DIR解析结果保存目录~/mineru-downloads
ENABLE_LOG开启日志false
MINERU_LOG_DIR日志目录~/.mineru-open-mcp/logs/

进阶:日志调试

开启日志:

{
  "mcpServers": {
    "mineru": {
      "command": "uvx",
      "args": ["mineru-open-mcp"],
      "env": {
        "MINERU_API_TOKEN": "你的token",
        "ENABLE_LOG": "true",
        "MINERU_LOG_DIR": "/Users/you/mineru-logs"
      }
    }
  }
}

日志文件位置:~/.mineru-open-mcp/logs/log_<timestamp>.txt


相关链接