想保存一篇优质的公众号文章,却苦于没有好工具?别愁!AiPy帮你一键搞定文章爬取,标题、正文、图片统统下载,省时又省力~
一、 AiPy爬取的优势
手动复制格式乱,排版需要重新调整。
图片下载效率低,一张张保存太耗时 ......
用常规方式保存公众号文章,往往无法规避上述问题。
这时候,具备强大网页爬取能力的 AiPy 将会成为你的绝妙好帮手!只需要提供公众号文章的链接,它就能自动实现文本、图片的爬取和分析。
- 全自动处理:只需提供链接,剩余工作全部自动完成
- 格式完整保留:标题、段落、图片位置清晰可辨
- 批量图片下载:所有图片一键保存,省时省力
二、 AiPy实操
01
下载AiPy
02
配置MCP
- 在 modelscope.cn/ 中的MCP广场中搜索“微信公众号爬虫”,找到图中的MCP工具
- 点击进入,按图示操作获取 MCP Server:
1)Python 环境准备:
确保系统已安装 Python 3.8 或更高版本。若未安装,可从 Python 官方网站下载并安装。
2)进入GitHub仓库,并将项目克隆到本地:
3)创建虚拟环境:在cmd中输入下方指令,创建并激活虚拟环境(推荐)
4)安装依赖:在虚拟环境中安装所需依赖
💡 Tips:过程中如有问题,可以直接让AiPy为你解答!
- 最后,在AiPy中进行MCP的配置即可
💡 Tips:框选部分根据文件位置自行替换!
03
打开mcp和联网搜索,输入提示词
用户只需附上文章链接,并对AiPy说:"爬取这篇文章并下载所有图片"。
AiPy立即开始工作:
- 解析链接,识别文章ID
- 获取文章完整内容(标题、正文共1392字)
- 识别并下载文章中的11张图片
- 将内容保存为TXT文件,图片保存到独立文件夹
成果展示
文本:
图片:
文章中的所有图片链接会被自动识别,AiPy会逐一下载并保存到本地,同时按照顺序命名,方便后续使用。
此外,还可以让AiPy对文章进行分析:
仅需一分钟,AiPy就帮你自动实现了文本、图片的爬取和分析!
有了AiPy,公众号文章保存再也不用愁!一键爬取、自动下载,让优质内容触手可及。