Python爬虫知识第二天(十六)

67 阅读1分钟

携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第18天,点击查看详情.

其他文章请点击主页查看哦~ 感兴趣的朋友可以看看~

前言

Python爬虫的第二天~

一、jupter

1、安装requests

坑:没看清楚requests,少打了最后一个s,一直提示错误 在这里插入图片描述

示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。

二、requests初体验

在这里插入图片描述

1.get请求

打对单词真的太重要了家人们

1)百度 在这里插入图片描述 2)川川csdn博客 在这里插入图片描述 3)两个网站(两个都是post+cookies)

这就是爬虫吗?天哪爱了爱了,内容真多 在这里插入图片描述 一个post一个put+cookies 在这里插入图片描述 一个post一个put,都没有cookies 在这里插入图片描述 4)get请求 在这里插入图片描述 直接解析得到的字典格式 在这里插入图片描述

5)传参数 如果不加红框内容,运行后与上图结果一致 6)获取cookies 在这里插入图片描述7)获取请求头 点击网页的刷新按钮 在这里插入图片描述 8)无请求头的无法访问 在这里插入图片描述 添加请求头后 在这里插入图片描述 获取cookies 在这里插入图片描述 使用获取到的cookie来获取网页 使用代码获取到的cookie,比川川的cookie短,然后user-agent,之前用的用不了,换成知乎找到的,也用不了 不理解 在这里插入图片描述 2021.11.12续 打对单词真的太重要了家人们 在这里插入图片描述 9)session可以实现同一个站点进去不同页面 在这里插入图片描述

2.抓取二进制数据

1)抓取github站点图标(非常的乱码) 在这里插入图片描述 爬自己的头像 在这里插入图片描述 爬图虫图片 在这里插入图片描述

3.post请求

1)数据表单提交 在这里插入图片描述 2)添加请求头 在这里插入图片描述 3)提交json 在这里插入图片描述 4)普通文件上传 在这里插入图片描述

总结

打对单词真的很重要!!! 复制全部内容和照着打存在差别,复制部分内容和复制全部内容也存在差别!