携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第18天,点击查看详情.
其他文章请点击主页查看哦~ 感兴趣的朋友可以看看~
前言
Python爬虫的第二天~
一、jupter
1、安装requests
坑:没看清楚requests,少打了最后一个s,一直提示错误
示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。
二、requests初体验
1.get请求
打对单词真的太重要了家人们
1)百度
2)川川csdn博客
3)两个网站(两个都是post+cookies)
这就是爬虫吗?天哪爱了爱了,内容真多
一个post一个put+cookies
一个post一个put,都没有cookies
4)get请求
直接解析得到的字典格式
5)传参数
6)获取cookies
7)获取请求头
点击网页的刷新按钮
8)无请求头的无法访问
添加请求头后
获取cookies
使用获取到的cookie来获取网页
使用代码获取到的cookie,比川川的cookie短,然后user-agent,之前用的用不了,换成知乎找到的,也用不了
不理解
2021.11.12续
打对单词真的太重要了家人们
9)session可以实现同一个站点进去不同页面
2.抓取二进制数据
1)抓取github站点图标(非常的乱码)
爬自己的头像
爬图虫图片
3.post请求
1)数据表单提交
2)添加请求头
3)提交json
4)普通文件上传
总结
打对单词真的很重要!!! 复制全部内容和照着打存在差别,复制部分内容和复制全部内容也存在差别!