用影刀小红书采集指定博主全部笔记

239 阅读2分钟

小红书采集指定博主全部笔记

一.详细教程

1.多维表初始化

**作用:**存储采集的笔记,可以看作是一个数据库,放数据的空间。

1.去飞书开放平台(open.feishu.cn/app?lang=zh…),新建一个应用。

2.进入应用右侧的权限管理,开通多维表格云文档两个的全部权限。

img

imgimg

3.创建版本并发布应用。

4.在凭证与基础信息获取 AppIdAppSecret

img

5.新建一个多维表(sxuwebtech.feishu.cn/base)。

6.给多维表添加应用。

img

7.获取多维表格ID

例如在sxuwebtech.feishu.cn/base/Mm4rbG…Mm4rbGcJAarsVgsZcRJcAVtUnHb是多维表格ID

img

就这样我们得到了AppIdAppSecret以及多维表格ID

2.设置自定义对话框

具体设置如下:

img

3.建立多维表连接

找到建立多维表格链接指令。

img

使用列出记录(视图)获取多维表内容。

img

使用json数据提取提取具体的列的内容。

img

可以通过打印日志查看是否成功了解。

4.打开网站

img

5.采集基本信息

采集基本信息,注意头像链接的获取依旧为获取属性src。

imgimg

6.循环采集每个笔记详情

循环依次采集笔记链接,笔记标题,笔记正文,笔记标签,笔记点赞数,笔记收藏数,笔记评论数,笔记类型,图片封面链接,发布时间等。

imgimg

imgimg

7.滚动加载笔记数量

先设置无限循环,设置已采集数量为0

img

内部仅判断达到标准,则退出循环,而外部循环在未达到标准时继续滚动一页来加载笔记。

img

8.同步多维表

同步多维表作者详情

img

同步多维表笔记详情

img

二.完整源码

img