Python爬虫知识第二天（十六）

2022-08-22 67 阅读1分钟

携手创作，共同成长！这是我参与「掘金日新计划 · 8 月更文挑战」的第18天，点击查看详情.

其他文章请点击主页查看哦~ 感兴趣的朋友可以看看~

前言

Python爬虫的第二天~

一、jupter

1、安装requests

坑：没看清楚requests，少打了最后一个s，一直提示错误在这里插入图片描述

示例：pandas 是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。

二、requests初体验

在这里插入图片描述

1.get请求

打对单词真的太重要了家人们

1)百度在这里插入图片描述 2）川川csdn博客 3)两个网站(两个都是post+cookies）

这就是爬虫吗？天哪爱了爱了，内容真多在这里插入图片描述一个post一个put+cookies 一个post一个put，都没有cookies 4)get请求直接解析得到的字典格式

5)传参数如果不加红框内容，运行后与上图结果一致 6）获取cookies 在这里插入图片描述 7)获取请求头点击网页的刷新按钮 8)无请求头的无法访问添加请求头后获取cookies 使用获取到的cookie来获取网页使用代码获取到的cookie，比川川的cookie短，然后user-agent，之前用的用不了，换成知乎找到的，也用不了不理解在这里插入图片描述 2021.11.12续打对单词真的太重要了家人们 9)session可以实现同一个站点进去不同页面

2.抓取二进制数据

1)抓取github站点图标（非常的乱码）在这里插入图片描述爬自己的头像爬图虫图片

3.post请求

1）数据表单提交在这里插入图片描述 2)添加请求头 3）提交json 4）普通文件上传

总结

打对单词真的很重要！！！复制全部内容和照着打存在差别，复制部分内容和复制全部内容也存在差别！