飞书文档附件文件下载RPA方案2.0来了!不仅是PDF,Word、PPT、Excel、视频都能批量导出了,还都是源文件

71 阅读5分钟

在之前我写了一篇 下载「下载受限的飞书PDF文档」,通解3种不同资源类型的飞书域名,可以处理3种资源类型的飞书PDF文件下载:

  • 飞书文件(file附件) :https://.feishu.cn/file/
  • 飞书文档(Word类型) :https://.feishu.cn/docx/
  • 飞书知识库(Wiki页面) :https://.feishu.cn/wiki/

但这种方案是通过【自动化翻页截图+图片合并成PDF】实现的,它能用,但问题也很明显:

  • 处理速度极慢(页数越多越崩溃)
  • 输出结果是"图片型PDF"(不便检索、复制、二次编辑)
  • 对很多需要"可编辑源文件"的场景并不友好

图片

**痛点就是优化的动力!**最近我又重新研究出一套更快、更"硬核"的方案:

还是通过影刀RPA来承载/实现的,只不过这次我们无需再逐个翻页截图拼接,而是直接"监听+请求"进行源文件下载

且支持下载的文件类型从仅支持PDF,升级到支持PDF、PPT、视频、普通电子表格、Word文档五大常规文件类型快速下载。

#关于"飞书文档类型"的信息补充:

  • 内嵌文档(嵌入主文档)- 将外部文件(Word、PDF、Excel、PPT等)上传后嵌入到飞书文档中
  • 独立文档(独立视图)- 上传的文件独立存在,有单独的访问链接

下面来看一下详细介绍和实现思路。

一、应用介绍

这是一款基于影刀RPA开发的"自动化下载飞书文档中PDF、PPT、视频、普通电子表格Word文件的RPA机器人(网页自动化) "。

不管文件是独立存在还是内嵌在飞书文档,都能直接下载源文件。

目前支持的具体功能点:

  • 支持两类常见飞书附件/嵌入文件结构。「内嵌文档(嵌入主文档)」:外部文件上传后嵌入飞书文档中;「独立文档(独立视图)」:文件独立存在,有单独访问链接
  • 支持源格式文件下载:原文件是什么格式,下载下来就是什么格式
  • 支持自定义保存路径:可自定义下载保存位置,方便分类管理
  • 支持自定义浏览器运行:可选择谷歌、360、Edge等主流浏览器运行
  • 内嵌文档支持"选择下载类型":可选择只下载:视频/PDF/PPT/表格/Word,默认全部下载

二、核心实现思路

V1.0版本是模拟人的眼睛(截图),V2.0版本则是模拟人的耳朵(监听)。该应用采用了**"网页监听 + HTTPS请求"**的策略,核心逻辑在于监听飞书文档加载时的接口响应。

这里有一个难点,我们实际要监听的资源路径(Request URL)有以下两种类型,需要分别处理。

第1种:传入的飞书文档地址

也就是在应用启动参数里输入的飞书链接。RPA机器人先打开它,并从页面加载过程里拿到关键接口的返回值。

第2种:另一类特殊 Request URL

这类URL格式为:...feishu.cn/space/api/d…...

找到它后,直接发起请求,从响应数据中解析出附件/嵌入文件的下载信息。

为了让你实现无感下载,我从“传入的飞书文档地址”返回的响应中获取了这个Request URL中的变量值,从而还原出这个资源路径:

【文档域名】/space/api/docx/pages

/client_vars?id=【obj_token】&mode=7&

limit=239&cursor=cursor

值&wiki_space_id=【space_id】&container_type=wiki2.0&container_id=【wiki后面的ID】,

这样就能做到:用户只需要复制飞书链接 → 机器人自动推导接口 → 自动解析 → 自动下载源文件

三、如何获取 & 应用?

1. 启动参数说明

启动应用后,用户需要依次选择以下参数:

  • 文档类型:根据文件类型自行选择"内嵌文档_嵌入主文档"或者"独立文档_独立视图"
  • 飞书文档地址:请输入飞书文档地址
  • 请选择浏览器类型:自定义选择Google Chrome浏览器等主流浏览器运行
  • 下载什么文件:视频、PDF、PPT、普通电子表格、Word
  • 选择文件保存位置:请选择文件保存路径

2. 使用环境 / 工具配置

为了保证机器人运行稳定,需满足下面这几个基础环境:

  • 影刀RPA账号
  • 使用Chrome 浏览器或其他支持的浏览器。
  • 安装影刀自动化插件,软件右上角头像点击 [工具-自动化插件]。
  • 应用暂时只支持 Windows 端,其他设备自行测试
  • 浏览器提前登录飞书账号
  • 浏览器"下载设置"中关闭"下载前询问每个文件的保存位置"

3. 使用注意事项

  • 运行过程中不要切换或关闭浏览器页面
  • 下载速度/稳定性与网络加载速度、文件本身大小有关,不要开魔法,静待处理完成。
  • 该应用仅供下载用户拥有授权的飞书文档文件,**禁止用于下载受版权保护且未经授权的内容。**用户需自行承担使用本工具的全部法律责任,开发者不对用户的任何行为负责。
  • 应用可能因飞书官方调整而失效,不确保能永久使用,且用且惜!以上。我们下期分享见!

-END-

  • 爱练字的96年ISTJ型互联网人/信息整合怪/工具人/影刀高级认证工程师。
  • 专注分享:RPA&AI自动化场景提效方案、效率软件安利、实用技能。"所有的生产要素都可以被构建,只有认知是壁垒",欢迎関注