最近有一些朋友留言,说自己在做小红薯,看到一些优质的博主需要提取这些优质博主的笔记,以便可以给对这些优质的博主的笔记内容做分析,从而可以对自己的笔记内容做一些优化。但是,提取这些优质博主的笔记都是人肉提取分析,耗时耗力,效率很低。
本次要分享的工作流可以一键提取小红薯对标优质博主的笔记,可以给你的小红薯创作之路提升一些效率:
- 一键提取目标博主的笔记内容
- 缩短目标账号分析时间
- 增加单位时间分析账号的时间
- 快捷建设优质博主内容库
整个工作流需要输入的参数不多,只需要输入cookies(下文会介绍)和优质博主首页,就可以把博主笔记的分析结果写入到飞书多维表格,包含作品标题、作品文案、点赞数,收藏数、评论数、笔记链接、笔记封面、作品视频下载地址和作品视频文案。
接下来,吾鳴会把整个工作流做一个拆解,工作流中会使用到一些代码和提示词,吾鳴都已经打包准备好。这些都比较长,所以吾鳴就不把它贴在文章中了。
工作流拆解
完整流程图:
表格字段板块:
提取板块:
写入表格板块:
流程节点详解
开始
接收博主首页地址、网页cookies
cookies:获取方式已经和代码提示词一起打包准备好
userProfileUrl:优质博主首页地址
1.插件:小红书 - xhs_auther_notes
cookiesStr、userProfileUrl俩参数分别选择开始节点的cookies、userProfileUrl,cursor不填。
2.插件:飞书多维表格 - create_base
name:引用第一个插件的nick_name结果,用于生成多维表格名称
forder_token:可以填入飞书表格文件夹的网页地址
3.插件:飞书多维表格 - create_table
app_token:引用第二个插件输出的app_token
name:引用第二个插件输出的name
fields:定义表格字段,因篇幅原因,与代码提示词资料包放一起,文末可领
4.业务逻辑:批处理
并行运行数量:可填1
批处理次数上限:采集多少篇笔记
input:选择第一个插件输出的notes,是一个Array类型
5.插件:小红书 - xhs_note_detail
cookieStr:引用开始节点的cookies
noteUrl:引用批处理节点的note_url
6.插件:小红书提取 - xhs_tiqu
PS:这个节点的插件名称是“小红书提取”,需要注意
xhs_url:引用批处理节点的note_url
7.插件:字幕提取 - generate_video_captions_sync
url:引用第六个插件,小红书提取插件的video输出
lang:支持汉语、英语,默认汉语
8.业务逻辑:选择器
如果:引用第七个插件输出的data结果
条件:选择“不为空”
9.插件:字幕提取 - generate_video_captions_sync
选择器后面再连接一个字幕提取插件,输入的选择和第七个插件一致。主要提取多次,再聚合可提高准确性。
10.业务逻辑:变量聚合
Group1:分别引用第七个、第九个字幕提取插件输出的data结果
11.业务逻辑:代码
input:引用第五个小红书插件输出的data
data:引用第十个变量聚合节点输出的Group1
output:这里输出的是一个Array,输出需要自定义请注意
代码:代码内容我已经打包准备好放到了文末
12.插件:飞书多维表格 - add_records
app_token:引用第二个插件create_base的app_token
records:引用第11个代码节点输出output
table_name:引用第二个插件create_base的name
结束
今天的分享就到这里,如果您觉得有收获的话,可以给个一键三连,您的鼓励是吾鳴持续输出的最大动力。工作流中需要的代码提示词等我都打包准备好了,感兴趣可以使用下方链接下载。