Python教程如何去爬取小海绵博客(1)

62 阅读1分钟

今天浅浅的发一个教程,教你如何去爬取小海绵、

首先你需要搭建一个python环境,相信你是来看小海绵博客的话,基本Python环境搭建是没问题的,环境不做限制,

接下来需要我们导入那么几个包request,sys,random,fake-useragent.

接下来附上代码

 复制代码
import requests import sys import fake_useragent import random from bs4 import BeautifulSoup url = ‘https://blog.996321.xyz/’ user_agent = fake_useragent.UserAgent().random headers = {‘User-Agent’: user_agent} response = requests.get(url, headers=headers) html = response.text soup = BeautifulSoup(html, ‘html.parser’) posts = soup.find_all(‘a’) for post in posts: print(post.text) print(post[‘href’]) 

 

于是你得到了这个结果

 

 欢迎随时抓取,但是请不要恶意进行攻击

 

兄弟们 来点强度