Python爬虫入门 ~ Requests一个类型六个属性

152 阅读1分钟

开启掘金成长之旅!这是我参与「掘金日新计划 · 12 月更文挑战」的第27天,点击查看活动详情

Requests

简介

Requests 唯一的一个非转基因的 Python HTTP 库,人类可以安全享用。它允许你发送纯天然,植物饲养的 HTTP/1.1 请求,无需手工劳动。你不需要手动为 URL 添加查询字串,也不需要对 POST 数据进行表单编码。Keep-alive 和 HTTP 连接池的功能是 100% 自动化的,一切动力都来自于根植在 Requests 内部的 urllib3

官方文档:cn.python-requests.org/zh_CN/lates…

快速上手:cn.python-requests.org/zh_CN/lates…

安装

pip install requests -i https://pypi.douban.com/simple

image.png

基本使用

Requests的用法和urllib类似,会用urllib的来上手非常快。这里也跟前面一样使用一个类型六个属性来引入Requests的基本使用。

引入requests

import requests

url = 'http://www.baidu.com'

response = requests.get(url)

一个类型

# 一个类型
print(type(response))

image.png

通过type函数我们可以看到该响应对象的类型为requests.models.Response,前面使用的urllib响应类型是http.client.HTTPResponse

encoding

响应数据的编码类型。

response.encoding = 'utf-8'

text

以字符串的形式来返回页面源码,这里需要注意的是,我们需要提前设置response的编码类型,不然中文的会有乱码问题。

print(response.text)

image.png

url

返回请求的路径。

print(response.url)

image.png

content

返回的是二进制的页面源码数据。

print(response.content)

image.png

status_code

返回响应的状态码。

print(response.status_code)

image.png

headers

返回的是响应头信息。

print(response.headers)

image.png