手把手教你用 mcp-server + Playwright 自动采集小红书高热度空气蒸锅做饭指南
Author:Gorit
Date:2025 年 9 月 28 日
目标:看完这篇文章你就能学会如何用 mcp-server + Playwright 自动采集小红书热门内容并保存到 Excel。
免责声明:本仓库所有代码示例仅用于学习交流,请勿用于商业用途!!!
项目地址
项目介绍
本项目演示了如何使用 vscode + mcp-server + Playwright 自动化采集小红书“空气蒸锅做饭指南”相关高热度帖子,并将数据保存为 Excel 文件。主要功能包括:
- 自动打开小红书网页版(已登录 Chrome)
- 搜索关键词“空气蒸锅 做饭指南”
- 按播放量/点赞/评论数筛选高热度内容
- 提取帖子标题、作者、发布时间、点赞/播放量、评论数、帖子链接等信息
- 保存为 Excel 文件,方便后续分析
环境准备
环境要求:
- macOS
- VSCode 1.99 及以上
- Github Copilot(模型建议 Claude 3.5 Sonnet)
- 已安装 mcp-server 插件和 Playwright
- Chrome 浏览器已登录小红书账号
操作步骤
- 打开 VSCode,进入本项目
xhs目录。 - 启动 mcp-server,确保 Playwright 可用。
- 通过 Copilot 指令,自动打开小红书网页版。
- 在搜索框输入“空气蒸锅 做饭指南”,回车。
- 自动筛选并采集数据最高(播放量、爱心、评论数)的相关帖子。
- 将采集结果保存为
air_steamer_top10.csv,可用 Excel 打开。
采集结果示例
见 air_steamer_top10.csv,包含如下字段:
- 帖子标题
- 作者
- 发布时间
- 播放量/点赞
- 评论数
- 帖子链接
结语
通过本项目,你可以快速采集小红书热门内容,自动化保存分析,适合内容运营、数据分析等场景。