Python爬虫入门 ~ Requests一个类型六个属性开启掘金成长之旅！这是我参与「掘金日新计划 · 12 月更文挑

开启掘金成长之旅！这是我参与「掘金日新计划 · 12 月更文挑战」的第27天，点击查看活动详情

Requests

简介

Requests 唯一的一个非转基因的 Python HTTP 库，人类可以安全享用。它允许你发送纯天然，植物饲养的 HTTP/1.1 请求，无需手工劳动。你不需要手动为 URL 添加查询字串，也不需要对 POST 数据进行表单编码。Keep-alive 和 HTTP 连接池的功能是 100% 自动化的，一切动力都来自于根植在 Requests 内部的 urllib3。

官方文档：cn.python-requests.org/zh_CN/lates…

快速上手：cn.python-requests.org/zh_CN/lates…

安装

pip install requests -i https://pypi.douban.com/simple

基本使用

Requests的用法和urllib类似，会用urllib的来上手非常快。这里也跟前面一样使用一个类型六个属性来引入Requests的基本使用。

引入requests

import requests

url = 'http://www.baidu.com'

response = requests.get(url)

一个类型

# 一个类型
print(type(response))

通过type函数我们可以看到该响应对象的类型为requests.models.Response，前面使用的urllib响应类型是http.client.HTTPResponse。

encoding

响应数据的编码类型。

response.encoding = 'utf-8'

text

以字符串的形式来返回页面源码，这里需要注意的是，我们需要提前设置response的编码类型，不然中文的会有乱码问题。

print(response.text)

url

返回请求的路径。

print(response.url)

content

返回的是二进制的页面源码数据。

print(response.content)

status_code

返回响应的状态码。

print(response.status_code)

headers

返回的是响应头信息。

print(response.headers)