手把手教你用 mcp-server + Playwright 自动采集小红书高热度空气蒸锅做饭指南

192 阅读2分钟

手把手教你用 mcp-server + Playwright 自动采集小红书高热度空气蒸锅做饭指南

Author:Gorit
Date:2025 年 9 月 28 日

目标:看完这篇文章你就能学会如何用 mcp-server + Playwright 自动采集小红书热门内容并保存到 Excel。

免责声明:本仓库所有代码示例仅用于学习交流,请勿用于商业用途!!!

项目地址

MCP Server 最佳实践

项目介绍

本项目演示了如何使用 vscode + mcp-server + Playwright 自动化采集小红书“空气蒸锅做饭指南”相关高热度帖子,并将数据保存为 Excel 文件。主要功能包括:

  • 自动打开小红书网页版(已登录 Chrome)
  • 搜索关键词“空气蒸锅 做饭指南”
  • 按播放量/点赞/评论数筛选高热度内容
  • 提取帖子标题、作者、发布时间、点赞/播放量、评论数、帖子链接等信息
  • 保存为 Excel 文件,方便后续分析

环境准备

环境要求:

  • macOS
  • VSCode 1.99 及以上
  • Github Copilot(模型建议 Claude 3.5 Sonnet)
  • 已安装 mcp-server 插件和 Playwright
  • Chrome 浏览器已登录小红书账号

操作步骤

  1. 打开 VSCode,进入本项目 xhs 目录。
  2. 启动 mcp-server,确保 Playwright 可用。
  3. 通过 Copilot 指令,自动打开小红书网页版。
  4. 在搜索框输入“空气蒸锅 做饭指南”,回车。
  5. 自动筛选并采集数据最高(播放量、爱心、评论数)的相关帖子。
  6. 将采集结果保存为 air_steamer_top10.csv,可用 Excel 打开。

采集结果示例

air_steamer_top10.csv,包含如下字段:

  • 帖子标题
  • 作者
  • 发布时间
  • 播放量/点赞
  • 评论数
  • 帖子链接

image.png

image.png

结语

通过本项目,你可以快速采集小红书热门内容,自动化保存分析,适合内容运营、数据分析等场景。