爬虫 - 轻踏云层的收藏集 - 掘金

爬虫

更多收藏集

6篇文章 · 0订阅

反击爬虫，前端工程师的脑洞可以有多大？

对于一张网页，我们往往希望它是结构良好，内容清晰的，这样搜索引擎才能准确地认知它。而反过来，又有一些情景，我们不希望内容能被轻易获取，比方说电商网站的交易额，教育网站的题目等。因为这些内容，往往是一个产品的生命线，必须做到有效地保护。这就是爬虫与反爬虫这一话题的由来。但是世…

土豆君32
8年前
21k
1.0k
36

反击爬虫，前端工程师的脑洞可以有多大？

用Node+wechaty写一个爬虫脚本每天定时给女(男)朋友发微信暖心话

在评论区偶然看到一位读者说可不可以用微信实现一下。然后最近刚好在做微信机器人的小项目，那就把这个定时任务放到微信上去做吧，说干就干，撸了一下午终于撸出来了。为了防止占用你的微信号，你和你的爱人添加我的微信后。你发送指定内容，我将会每天帮你发送消息

Leo_chen
7年前
32k
647
190

前端工程师的一大神器——puppeteer

Browser：这是一个浏览器实例，可以拥有浏览器上下文，可通过 puppeteer.launch 或 puppeteer.connect 创建一个 Browser 对象。 BrowserContext：该实例定义了一个浏览器上下文，可拥有多个页面，创建浏览器实例时默认会创建一…

前端点线面
5年前
20k
90
8

前端工程师的一大神器——puppeteer

node.js爬虫入门（三）写一个自动爬虫服务

上次写了第二篇爬虫教程 node.js爬虫入门（二）爬取动态页面(puppeteer) 讲解了使用 puppeteer 开启无头浏览器进行动态数据的爬取，已经是一年前的事情了，之所以相隔这么久没更新是

PEAL
4年前
2.0k
8
5

node.js爬虫入门（二）爬取动态页面(puppeteer)

之前第一篇爬虫教程node.js爬虫入门（一）爬取静态页面讲解了静态网页的爬取，十分简单，但是遇到一些动态网页（ajax）的话，直接用之前的方法发送请求就无法获得我们想要的数据。这时就需要通过爬取动态

PEAL
5年前
6.9k
4
1

node.js爬虫入门（一）爬取静态页面

说到爬虫其实并没有想象中那么复杂，原理就是向目标URL发送请求然后把响应解析成我们想要的数据格式，如果涉及Token鉴权则比较复杂一点，本次只讲解最简单的入门静态爬虫。node.js中实现爬虫推荐两个

PEAL
5年前
1.2k
点赞
评论