首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
爬虫
订阅
闰土随言
更多收藏集
微信扫码分享
微信
新浪微博
QQ
4篇文章 · 0订阅
7大平台自媒体数据一键爬取!MediaCrawler:无需逆向,零门槛搞定小红书/抖音/B站内容采集
引言:自媒体时代的数据采集痛点 在信息爆炸的今天,自媒体平台已成为内容创作和传播的核心阵地。无论是市场调研、竞品分析还是学术研究,获取这些平台的公开数据都至关重要。然而,面对各大平台的反爬机制和复杂的
深度模拟用户行为:用Playwright爬取B站弹幕与评论数据
💡 引言:B站数据为何如此“难爬”? B站(Bilibili)作为国内最受欢迎的视频弹幕网站之一,页面采用大量JavaScript渲染,数据接口绑定复杂的登录验证和加密参数,直接使用 requests
微软开源最强Python自动化神器Playwright!不用写一行代码!
大家好,我是boy哥。 相信玩过爬虫的朋友都知道selenium,一个自动化测试的神器工具。写个Python自动化脚本解放双手基本上是常规的操作了,爬虫爬不了的,就用自动化测试凑一凑。 虽然selenium有完备的文档,但也需要一定的学习成本,对于一个纯小白来讲还是有些门槛的。…
【爬虫实战】用Python采集任意小红书笔记下的评论,爬了10000多条,含二级评论!
马哥原创:用Python采集小红书评论,抓取字段包含:笔记链接,页码,评论者昵称,评论者id,评论者主页链接,评论时间,评论IP属地,评论点赞数,评论级别,评论内容。