Python爬虫入门教程30：爬取拉勾网招聘数据信息

用户57923016702

2024-09-18 175 阅读3分钟

Python爬虫入门教程14：有声书音频爬取

Python爬虫入门教程15：音乐网站数据的爬取

Python爬虫入门教程17：音乐歌曲的爬取

Python爬虫入门教程18：好看视频的爬取

Python爬取入门教程19：YY短视频的爬取

Python爬虫入门教程20：IP代理的爬取使用

Python爬虫入门教程21：付费文档的爬取

Python爬虫入门教程22：百度翻译JS解密

Python爬虫入门教程23：A站视频的爬取，解密m3u8视频格式

Python爬虫入门教程24：下载某网站付费文档保存PDF

Python爬虫入门教程25：绕过JS加密参数，实现批量下载抖某音无水印视频内容

Python爬虫入门教程26：快手视频网站数据内容下载

Python爬虫入门教程27：爬取某电商平台数据内容并做数据可视化

Python爬虫入门教程28：爬取微博热搜榜并做动态数据展示

Python爬虫入门教程29：爬取某团烤肉店铺数据内容并做可视化展示

PS：如有需要 Python学习资料 以及 解答 的小伙伴可以加点击下方链接自行获取

python免费学习资料以及群交流解答点击即可加入

基本开发环境💨

Python 3.6
Pycharm

相关模块的使用💨

import csv

import requests

安装Python并添加到环境变量，pip安装需要的相关模块即可。

💥需求数据来源分析

在这里插入图片描述

通过开发者工具, 抓包分析之后知道数据是从哪可以获取之后, 可以查看一下请求的url地址以及请求方式等

在这里插入图片描述

💥代码实现

import csv

import requests

f = open('data.csv', mode='a', encoding='utf-8', newline='')

csv_writer = csv.DictWriter(f, fieldnames=[

'标题',

'城市',

'公司名字',

'学历',

'经验',

'薪资',

'公司福利',

'详情页',

])

csv_writer.writeheader()

url = 'www.lagou.com/jobs/positi…'

data = {

'first': 'true',

'pn': '1',

'kd': 'python'

}

headers = {

'cookie': 'cookie',

'referer': 'www.lagou.com/jobs/list_p…',

'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.71 Safari/537.36'

}

response = requests.post(url=url, data=data, headers=headers)

result = response.json()['content']['positionResult']['result']

for index in result:

pprint.pprint(index)

title = index['positionName'] # 标题

city = index['city'] # 城市

area = index['district'] # 区域

city_area = city + '-' + area

company_name = index['companyFullName'] # 公司名字

edu = index['education'] # 学历

money = index['salary'] # 薪资

exp = index['workYear'] # 经验

boon = index['positionAdvantage'] # 公司福利

href = f'www.lagou.com/jobs/{index…'

job_info = index['positionDetail'].replace('
\n', '').replace('
', '')

dit = {

'标题': title,

'城市': city_area,

'公司名字': company_name,

'学历': edu,

'经验': exp,

'薪资': money,

最后

🍅 硬核资料：关注即可领取PPT模板、简历模板、行业经典书籍PDF。
🍅 技术互助：技术群大佬指点迷津，你的问题可能不是问题，求资源在群里喊一声。
🍅 面试题库：由技术群里的小伙伴们共同投稿，热乎的大厂面试真题，持续更新中。
🍅 知识体系：含编程语言、算法、大数据生态圈组件（Mysql、Hive、Spark、Flink）、数据仓库、Python、前端等等。

了解详情：docs.qq.com/doc/DSnl3ZG…