辛苦写的小红书笔记发出后数据惨淡,不知道是内容不行,还是被“隐形限流”了
好不容易火了一篇,转眼又被同行举报违规
平台的内容巡检持续在线,哪天一觉醒来,轻则删帖,重则封号
收到“涉嫌XXX”的通知,却没人告诉你到底哪句话触雷
……
很多人还在靠"经验"发小红书笔记,但经验在算法面前其实挺脆弱。有时候根本不是内容不好,而是你踩了平台规则的“雷区”。
小红书官方的规则其实摆得很明白(*查看路径:创作者中心 → 全部服务 → 安全中心 → 规则百科),可问题是,你真的会一个个点开、把上百条细则背下来吗?显然不现实!
AI时代,我们完全可以用一种更“聪明”的方式来实现“内容合规审查”,比如:用影刀RPA把平台所有内容规则一条不漏地扒下来,形成一个知识库,然后投喂给AI大模型,训练出一个“小红书内容合规审核专家” 的智能体。
这样,以后在发布笔记前直接把文案丢给它,它就会基于规则知识库和智能体设定来智能判断:哪些词敏感,哪些容易被限流,哪些表达不合规并提供修改建议。
这是一个涉及“嵌套循环 + 手机懒加载处理”的自动化实战案例,真正难的不是“能不能抓到”,而是怎么在不断加载新内容的同时,不重、不漏、不断线。
一、开发思路
打开小红书App的“规则百科”页面,我们会发现,这是一个典型的“双重嵌套循环”结构 :
1. 外层循环
页面左侧是“违法违规”、“医疗健康”、“商业秩序”等大类,右侧是对应大类下的子规则项,比如“行业不规范”、“虚假营销”等等。
2. 内层循环
当你点击任何一个子规则(比如“虚假种草行为”),进入详情页后,会发现顶部还可能存在多个标签页,比如“招募虚假体验写手”、“发布虚假种草体验”。
对应的,我们的RPA流程设计是:依次遍历右侧规则列表 → 进入每个规则项详情页→ 遍历循环顶部所有Tab标签页,提取文本&写入Word → 返回上一层,继续下一项**…直到把所有类目、所有子规则、所有**Tab页的内容全部采集完毕。
二、关键流程指令
整个流程的核心逻辑,是一个“外循环(规则分类遍历)、内循环(标签页采集)、懒加载控制(动态内容加载检测)”的多层自动化结构。
1. 外循环
2. 内循环(Tab)
3. 内循环(详情页)
小红书的规则页面是手机端懒加载结构,即需要不断下拉才能加载出完整内容。这里提供两种实现思路参考:
方案01:基于文本内容的去重与判断。每次滚动都抓相似元素(文本),并根据页面模块分区和文本内容做判断、写入。
方案02:基于UI树结构的去重与判断。每次滚动获取一次UI树(XML源码),拼接所有滚动结果形成完整结构,然后通过resource_id + index值逐级解析与写入。下图为"方案02"指令流程。
三、效果演示
连接手机,直接启动运行,无需配置参数👇👇
四、如何获取&使用?
1. 环境/工具配置
-
需要影刀RPA账号
-
手机自动化环境安装配置
2. 注意事项
-
运行过程中,电脑可以干别的,手机不要动
-
运行前,确保手机停留在小红书规则百科界面
-END-
• 爱练字的ISTJ型互联网人/信息整合怪/工具人/影刀高级认证工程师。 • 专注分享:RPA&AI自动化场景提效方案、效率软件安利、实用技能。"所有的生产要素都可以被构建,只有认知是壁垒",欢迎関注 @掌心向暖
推荐阅读:
• 拒绝品牌碰瓷!如何通过影刀RPA为品牌IP搭建一套高效的“内容合规治理”工作流? • 那些拥有上千浏览器书签/收藏夹的电脑用户,是怎么管理书签的? • 不会编程的我开发了一款近900行指令的自动化RPA应用,完美解决98%以上复制受限的飞书文档!! • 飞书文档附件文件下载RPA方案2.0来了!不仅是PDF,Word、PPT、Excel、视频都能批量导出了,还都是源文件