OpenClaw上有没有可以将pdf转成markdown的skill?

0 阅读2分钟

1. 工具介绍

OpenClaw 上有可将 PDF 转成 Markdown 的 Skill,即TextIn xParse 文档解析 Skill,该 Skill 已正式上架 ClawHub,可免费使用,每日提供 1000 页解析额度,能一键把 PDF、Word、PPT、Excel、长截图等复杂文档转为干净规整的 Markdown,是 Agent 生态里的高精度文档解析工具。

2.能力点呈现

(1)全格式兼容,覆盖主流文档类型

支持 PDF、Word、Excel、PPT、图片(jpg/png/bmp/tiff/webp)、HTML、OFD 等 20 + 常见格式输入,满足多场景文档转换需求。

(2)结构完整还原,保留文档原生骨架

可完整还原跨页表格、目录层级、页眉页脚、标题结构等内容,不丢失文档关键信息。

(3)极速解析,适配大规模批处理

百页文档约 1.5 秒即可完成解析,高效应对企业大批量文档处理需求。

(4)标准 Markdown 输出,适配 Agent 生态

输出保留文档层级与语义的 Markdown 格式,是 LLM 与 Agent 最适配的知识形态。

(5)精确坐标回显,方便校对与可视化

返回块级及字符级坐标信息,便于前端展示与后续内容审核校对。

(6)免费易用,零门槛上手

免登录即可免费使用,每日 1000 页额度;无需写代码、调 API,和 Agent 对话即可使用。

3. 安装与使用步骤

安装方式(二选一)

(1)Agent 对话安装

在 Agent 对话框输入:

帮我从技能市场安装 intsig-textin/xparse-parser

无技能市场时则通过npx安装:npx skills add intsig-textin/xparse-skills --yes

如果npx也没有,则可以从以下仓库里任选一个手动安装:​​https://github.com/intsig-textin/xparse-skills;https://gitee.com/intsig-textin/xparse-skills​

(2)手动安装

从以下任一地址下载 zip 文件,解压后,放到 agent 对话框,让模型使用解压里面的 skill.md 文件即可:

GitHub:​GitHub - intsig-textin/xparse-skills · GitHub​​****

Gitee:​https://gitee.com/intsig-textin/xparse-skills​​****

ClawHub:​​TextIn xParse Document Parse — ClawHub​

快速使用指令

在 OpenClaw、ZeroClaw、Claude Code等 Agent 平台装上 xparse-parse Skill,只需要说一句话,它就能自动完成文档解析、格式转换全部流程。

● “ 帮我读一下这份 PDF 合同,提取关键条款 ”

● “ 把这个报告转成 Markdown,保存到桌面 ”

● “ 这份加密 PDF 密码是 123456,帮我解析前 10 页 ”

● “ 提取这张表格图片里的内容,输出 JSON ”

3. 应用场景介绍

(1)企业文档处理

将合同、产品手册、经营数据、战略规划等非结构化文档编译为 Markdown,成为 Agent 可调用的知识资产,支撑检索、问答、分析、报告生成。

(2)开发者效率提升

省去文档解析技术积累,直接获得商业级稳定性与效果,快速将文档能力嵌入生产环境。

(3)日常办公场景

快速转换各类办公文档,无需复杂操作,降低格式处理成本。