我把语雀多年的文档一口气搬回本地,这个开源工具真救命

6 阅读8分钟

很多人把语雀当知识库,我也一样。

但有一个问题,平时不觉得,一旦开始做 AI 知识治理、个人知识库迁移、长期备份时,它会突然变成一个很现实的痛点:

文档都在语雀里,但它们不在我本地。
不在本地,就不算真正属于我的工作流。

最近我在整理自己的外部大脑时,决定把语雀里过去几年积累的文档系统性下载回来,重新接入本地知识库。结果试了一圈,最后真正让我觉得“这东西能用、好用、值得推荐”的,是这个项目:

image.png

一句话先下结论:

如果你想把语雀知识库批量导出成 Markdown,本地归档、迁移到 Obsidian、接入 AI 知识库或者自己做二次整理,yuque-dl 是我目前见到最好用的一类工具。


它解决的不是“下载文档”,而是“把知识真正收回本地”

很多人会觉得,语雀不是本来就能看吗,为什么还要下载?

因为在 AI 时代,知识只是“在线看”已经不够了。

你真正会碰到的需求,其实是这些:

  • 想把过去几年写过的文档重新纳入自己的知识库
  • 想做本地全文检索
  • 想让 AI 直接读取和利用这些知识
  • 想做长期备份,避免平台绑定
  • 想把内容迁移到 Obsidian、Git、私有知识系统

这时候,“能不能批量导出来”就不再是可选项,而是基础设施。

yuque-dl 的价值就在这里:

  • 直接把语雀知识库拉到本地
  • 导出成 Markdown
  • 图片能一起下载
  • 附件也能处理
  • 支持整库导出,也支持单篇文档导出
  • 私有库和分享私有库也能处理

它不是玩具脚本,而是真能进入工作流的工具。


我为什么会觉得它好用

不是因为它“功能列表很多”,而是因为它在几个关键点上非常对路。

1. 安装和使用门槛很低

它本质就是一个 CLI:

npm install -g yuque-dl

用法也很直接:

yuque-dl "https://www.yuque.com/xxx/yyy"

下载单篇文档:

yuque-dl doc "https://www.yuque.com/xxx/yyy/zzz"

这点很重要。
很多工具不是不能用,而是“安装完你还得再研究半小时”。
yuque-dl 的好处是,装完基本就能开始干活。

2. 对“真实知识库”友好,而不是只对 demo 友好

我这次不是拿一个只有几篇文档的小仓试,而是直接拉自己的几个语雀库,里面包含:

  • 前端工程与商业项目积累
  • 武侠小说世界观与素材库
  • 区块链与 EVM 学习笔记
  • 生活随笔与个人表达

也就是说,不只是技术文档,还有:

  • 多层目录
  • 图片
  • 附件
  • 偶发失效链接
  • 私有库

这类真实场景往往比工具 README 里的示例复杂得多。

yuque-dl 在这方面给我的感觉是:

它不是“理论支持很多”,而是“碰到真实脏数据时依然能持续往下跑”。

这点我非常看重。

3. 对失败场景处理得还算务实

这次导出过程中,我也遇到了几种失败情况:

  • 某些语雀文档本身已经 404
  • 个别图片资源下载失败
  • 某些“画板类型”文档不支持转 Markdown

但这个工具没有因为个别条目失败就整个崩掉,而是:

  • 继续下载其余文档
  • 最后给出失败列表
  • 允许重新执行补抓

这就很工程化。

因为做知识迁移最怕的不是“偶尔失败”,而是:

一个资源失败,整个库重来一遍。

yuque-dl 没走这条坑路。


它最适合哪几种人

如果你是下面这些类型,我会很推荐你用:

1. 想把语雀接回本地的人

你已经不满足于“文档在平台上能看”,而是希望:

  • 文件在自己磁盘里
  • 能进 Git
  • 能进 Obsidian
  • 能进 AI 知识库

那这个工具非常合适。

2. 做 AI 知识库的人

这一点是我自己最强的使用动机。

因为 AI 要用你的知识,前提不是“你写过”,而是:

这些知识得先变成机器可读、可检索、可组织的本地文件。

如果文档一直锁在平台里,AI 工作流始终是断的。

而导出成 Markdown 后,你就可以继续做:

  • 结构整理
  • 元数据补充
  • 知识脱水
  • RAG 接入
  • 分享再加工

3. 想做长期备份的人

平台型工具用久了,大家迟早会意识到一件事:

只存在线平台上的知识,不算真正意义上的可控资产。

把文档拉回本地,哪怕你短期还继续在语雀里写,也会安心很多。


私有库这块,它也比我预期中实用

这个是我很在意的一点。

因为公开库能下,不代表工具真的能进入日常使用。 真正有价值的是:

  • 你自己的私有知识库能不能下
  • 别人分享给你的私有库能不能下
  • 公开但有密码的知识库能不能处理

yuque-dl 这方面是支持的。

核心方式是带 cookie token:

yuque-dl "知识库地址" -t="你的_yuque_session"

如果是企业语雀,还能自己指定 cookie key:

yuque-dl "知识库地址" -k "cookie_key" -t="cookie_value"

这意味着它不是只做“公开内容下载”,而是能真正覆盖你的私人知识资产迁移。

当然,私有库下载也有个前提:

你得有合法访问权限。
它不会帮你绕过权限,也不会“破解”语雀。

这点我反而觉得是优点,边界是清楚的。


我这次实测后的几个真实感受

如果只说一句“这个工具好用”,其实没什么信息量。

所以我把这次真实感受压成 4 条。

1. 真正有价值的是“批量导出能力”

单篇复制粘贴谁都会。

真正累死人的是:

  • 几十篇
  • 上百篇
  • 多级目录
  • 图片成堆
  • 私有内容混杂

这时候,CLI 工具的价值才出来。

2. Markdown 形式特别适合后续二次加工

一旦导下来是 Markdown,后面你就有太多玩法了:

  • 接入本地知识库
  • 改文件名
  • 批量补 frontmatter
  • 再分类
  • 再生成分享稿
  • 再喂给 AI

这比导成 PDF 或截图存档要强得多。

3. 它很适合做“平台脱锚”

这不是说你以后就不用语雀了。

而是说:

你的写作平台可以继续是语雀,
但你的知识主权不能只在语雀。

这个区分特别重要。

4. 它能直接进入程序员工作流

这是我最喜欢的一点。

因为它是 CLI。

CLI 的意义不是“更酷”,而是:

  • 可脚本化
  • 可批量化
  • 可自动化
  • 可集成到后续整理流程

比如你完全可以继续往下做:

  • 下载语雀库
  • 自动归档到本地知识仓
  • 跑一轮知识脱水
  • 再进入 AI 检索系统

这样它就不是一个下载工具,而是一个知识迁移管道的入口。


当然,它也不是没有边界

我这次实测下来,还是有几个点要提前说清楚。

1. 不是所有语雀文档类型都支持

比如“画板类型”的文档,就会失败。

这不是你操作错了,而是当前工具能力边界就在这里。

2. 个别历史文档可能已经失效

如果语雀文档本身 404,工具也没法救。

3. 图片和附件偶尔会受资源链接影响

有些远程资源会下载失败,但好在正文通常不会跟着一起丢。

4. 私有库需要你自己准备登录态

这很正常,但意味着它不是那种“什么都不用管,一键全自动”的产品化工具。

不过对程序员来说,这通常不是问题。


最后说结论

如果你问我:

有没有一个工具,能把语雀知识库真正搬回本地,而且足够进入程序员工作流?

我现在会直接回答:

有,就是 yuque-dl

它最打动我的,不是“功能做得多花”,而是:

  • 安装快
  • 上手快
  • CLI 友好
  • 支持整库
  • 支持私有库
  • 导出结果适合继续做知识治理

对我来说,它解决的不是“下载文档”这么简单,而是:

把多年积累在平台里的知识,重新接回到我自己的本地系统里。

这件事,在 AI 时代尤其重要。

因为知识一旦不能回到你自己的系统里,它就很难真正成为你的长期资产。


如果你也在做:

  • 本地知识库
  • AI 外部大脑
  • Obsidian 整理
  • 文档平台迁移
  • 个人知识资产备份

我建议你可以直接试试这个项目:

我自己的结论很简单:

这不是“语雀下载工具”而已。
它更像是把平台知识重新拉回个人主权的一把铲子。