EltonChouTwitterMediaHarvest:Twitter 媒体资源批量采集工具

29 阅读2分钟

EltonChou/TwitterMediaHarvest:Twitter 媒体资源批量采集工具

TwitterMediaHarvest 在 GitHub 上已经拿到 978 Star 了。 这个工具由 EltonChou 开源,专门用于批量采集 Twitter 平台的媒体资源,包括图片、视频等内容,支持自定义采集规则和导出格式。

正文顶部截图

主要功能

这个工具核心功能是批量获取 Twitter 用户发布的所有媒体内容,支持按时间范围筛选,可导出为不同的文件格式。用户输入目标 Twitter 用户主页链接,工具自动遍历所有发布内容,提取其中的媒体资源并下载到本地。 工具支持断点续传,采集过程中如果出现网络中断,重新启动后可以从上次中断的位置继续采集,不需要重新遍历所有内容。采集的媒体文件会保留原始元数据,包括发布时间、发布者信息、原推文链接等,方便后续溯源。

README区域截图

适用场景

需要批量保存 Twitter 特定账号媒体内容的用户,做内容归档的研究人员,以及需要采集社交媒体素材的创作者都可以使用这个工具。工具不需要复杂的配置,输入目标链接即可启动采集流程。 对于需要定期采集特定账号内容的用户,工具支持设置定时任务,自动按设定的时间间隔执行采集操作,不需要手动触发。采集到的内容可以自动分类存放,按账号名称或者发布时间划分目录。

使用方式

用户需要先配置 Twitter 账号的认证信息,在配置文件中填写对应的 Token 后即可运行工具。命令行启动后,输入要采集的用户 ID 或主页链接,工具自动执行采集任务,进度会实时显示在终端中。 采集完成后,所有媒体文件会保存在指定的输出目录,文件名保留原始发布时间信息,方便后续整理。用户也可以设置过滤规则,只采集特定分辨率或者特定格式的媒体文件,减少不必要的存储空间占用。

开源地址:github.com/EltonChou/T…