爬虫 - 闰土随言的收藏集 - 掘金

爬虫

更多收藏集

4篇文章 · 0订阅

7大平台自媒体数据一键爬取！MediaCrawler：无需逆向，零门槛搞定小红书/抖音/B站内容采集

引言：自媒体时代的数据采集痛点在信息爆炸的今天，自媒体平台已成为内容创作和传播的核心阵地。无论是市场调研、竞品分析还是学术研究，获取这些平台的公开数据都至关重要。然而，面对各大平台的反爬机制和复杂的

极客悟道
8月前
1.1k
点赞
评论

深度模拟用户行为：用Playwright爬取B站弹幕与评论数据

💡 引言：B站数据为何如此“难爬”？ B站（Bilibili）作为国内最受欢迎的视频弹幕网站之一，页面采用大量JavaScript渲染，数据接口绑定复杂的登录验证和加密参数，直接使用 requests

就是帅我不改
7月前
378
点赞
评论

微软开源最强Python自动化神器Playwright！不用写一行代码！

大家好，我是boy哥。相信玩过爬虫的朋友都知道selenium，一个自动化测试的神器工具。写个Python自动化脚本解放双手基本上是常规的操作了，爬虫爬不了的，就用自动化测试凑一凑。虽然selenium有完备的文档，但也需要一定的学习成本，对于一个纯小白来讲还是有些门槛的。…

GitHuboy
5年前
30k
265
32

【爬虫实战】用Python采集任意小红书笔记下的评论，爬了10000多条，含二级评论！

马哥原创：用Python采集小红书评论，抓取字段包含：笔记链接,页码,评论者昵称,评论者id,评论者主页链接,评论时间,评论IP属地,评论点赞数,评论级别,评论内容。

马哥python说
2年前
1.3k
1
评论

【爬虫实战】用Python采集任意小红书笔记下的评论，爬了10000多条，含二级评论！