如何导入Scrapy框架1.导入Scrapy框架和requests库，requests库用于发送HTTP请求，Scrap

　　1.导入Scrapy框架和requests库，requests库用于发送HTTP请求，Scrapy框架用于爬虫开发。

　　```python

　　import scrapy

　　import requests

　　```

　　2.创建一个Spider类，Spider类是Scrapy框架中的一个类，用于定义爬虫的行为。

　　```python

　　class AnjukeSpider(scrapy.Spider):

　　```

　　3.定义Spider的名称和允许爬取的域名。

　　```python

　　name='anjuke'

　　allowed_domains=['www.anjuke.com']

　　```

　　4.定义Spider的开始URL，也就是要爬取的网站的首页。

　　```python

　　start_urls=['www.anjuke.com/']

　　```

　　5.定义Spider的回调函数，也就是当Spider抓取到网页时，要执行的函数。

　　```python

　　def parse(self,response):

　　```

　　6.使用requests库发送HTTP请求，获取网站的HTML内容。

　　```python

　　html=requests.get(response.url,proxies={'http':'www.duoip.cn:8000'})

　　```

　　7.使用BeautifulSoup库解析HTML内容。

　　```python

　　soup=BeautifulSoup(html.text,'html.parser')

　　```

　　8.使用正则表达式或者XPath选择器选择出需要的图片链接。

　　```python

　　image_urls=soup.select('img')['src']

　　```

　　9.使用requests库再次发送HTTP请求，获取图片内容。

　　```python

　　image=requests.get(image_urls,proxies={'http':'www.duoip.cn:8000'})

　　```

　　10.将图片保存到本地。

　　```python

　　with open('image.jpg','wb')as f:

　　f.write(image.content)

　　```

　　11.定义Spider的结束条件。

　　```python

　　return response.follow(image_urls,self.parse)

　　```

　　12.最后，定义Spider的启动函数，当调用这个函数时，Spider就会开始爬虫。

　　```python

　　def start_requests(self):

　　yield scrapy.Request(url=self.start_urls[0],callback=self.parse)

如何导入Scrapy框架.png 　　```

　　以上就是使用Scrapy框架和requests库，爬取www.anjuke.com/网站图片的全部代码。需…