Python爬虫入门教程23:A站视频的爬取,解密m3u8视频格式
Python爬虫入门教程25:绕过JS加密参数,实现批量下载抖某音无水印视频内容
Python爬虫入门教程27:爬取某电商平台数据内容并做数据可视化
Python爬虫入门教程28:爬取微博热搜榜并做动态数据展示
Python爬虫入门教程29:爬取某团烤肉店铺数据内容并做可视化展示
PS:如有需要 Python学习资料 以及 解答 的小伙伴可以加点击下方链接自行获取
-
Python 3.6
-
Pycharm
import csv
import requests
安装Python并添加到环境变量,pip安装需要的相关模块即可。
通过开发者工具, 抓包分析之后知道数据是从哪可以获取之后, 可以查看一下请求的url地址以及请求方式等
import csv
import requests
f = open('data.csv', mode='a', encoding='utf-8', newline='')
csv_writer = csv.DictWriter(f, fieldnames=[
'标题',
'城市',
'公司名字',
'学历',
'经验',
'薪资',
'公司福利',
'详情页',
])
csv_writer.writeheader()
url = 'www.lagou.com/jobs/positi…'
data = {
'first': 'true',
'pn': '1',
'kd': 'python'
}
headers = {
'cookie': 'cookie',
'referer': 'www.lagou.com/jobs/list_p…',
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.71 Safari/537.36'
}
response = requests.post(url=url, data=data, headers=headers)
result = response.json()['content']['positionResult']['result']
for index in result:
pprint.pprint(index)
title = index['positionName'] # 标题
city = index['city'] # 城市
area = index['district'] # 区域
city_area = city + '-' + area
company_name = index['companyFullName'] # 公司名字
edu = index['education'] # 学历
money = index['salary'] # 薪资
exp = index['workYear'] # 经验
boon = index['positionAdvantage'] # 公司福利
href = f'www.lagou.com/jobs/{index…'
job_info = index['positionDetail'].replace('
\n', '').replace('
', '')
dit = {
'标题': title,
'城市': city_area,
'公司名字': company_name,
'学历': edu,
'经验': exp,
'薪资': money,
最后
🍅 硬核资料:关注即可领取PPT模板、简历模板、行业经典书籍PDF。
🍅 技术互助:技术群大佬指点迷津,你的问题可能不是问题,求资源在群里喊一声。
🍅 面试题库:由技术群里的小伙伴们共同投稿,热乎的大厂面试真题,持续更新中。
🍅 知识体系:含编程语言、算法、大数据生态圈组件(Mysql、Hive、Spark、Flink)、数据仓库、Python、前端等等。