各家招聘网站上企业发布的招聘信息多如牛毛,即使用上了多条件筛选,我们也无法把各家公司相应岗位的一系列信息一一对应放在一张表里去对比选择。今天给大家带来的这篇文章正是针对上述需要而给出的一套办法,供大家参考学习。
爬虫目标
要求:搜索“大数据”专业,爬相关公司的招聘信息。列数不少于10列,行数不少于3000 。
目标:搜索“大数据”,爬取智联招聘 北京上海广州深圳天津武汉西安 职位名称,企业名称,薪资,什么市(区),学历要求,经验要求,公司规模,公司性质,工作类型,详情页链接https
具体过程
登录网站,搜索大数据,右键查看网页源代码
Ctrl+F搜索大数据工程师,发现数据都在网页源代码中
基本思路有了,可用正则直接在源码里匹配得到数据,也可以打开开发者工具抓包分析接口用scrapy爬。这篇博客用正则表达式匹配。
pycharm响应成功。
然后用正则写代码就行了。
源码
爬取下来的各家公司招聘信息只要加以整理就可以更加直观地对比,有针对性地按需去了解了。
以上就是这篇文章的全部内容了,想要学习更多Python相关知识和使用技巧的同学戳视频链接开始进一步学习,有兴趣了解更多编程技术的同学也可以点击Java300集进行Java的学习。