投递简历总是石沉大海？HR表现的机会都不给你？【Python爬虫实战：简历模板采集】携手创作，共同成长！这是我参与「掘金

携手创作，共同成长！这是我参与「掘金日新计划 · 8 月更文挑战」的第17天，点击查看活动详情简历模板下载工具准备项目思路解析简易源码分享工具准备数据来源: 站长素材开发环境：win10、python3.7 开发工具：pycharm、Chrome

项目思路解析找到进入详情页面的超链接地址，以及对应简历的名字提取出参数信息

使用xpath语法的时候需要注意网页源代码跟浏览器页面渲染的页面会有出入，提取数据需要根据网页源代码来提取

1 2 3 4 5 6 进入详情页面找到对应的详情页面的地址提取对应rar的下载地址

1 2 简易源码分享 import requests
from lxml import etree

headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:86.0) Gecko/20100101 Firefox/86.0', }

for i in range(2, 10): url = f'sc.chs={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:86.0) Gecko/20100101 Firefox/86.0'}).content # 获取二进制数据 path = './moban/' + name + '.rar'
with open(path, 'wb') as fp:
fp.write(result) # 保存文件

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 文章知识点与官方知识档案匹配，可进一步学习相关知识

简历模板下载

数据来源: [站长素材]( 开发环境：win10、python3.7
开发工具：pycharm、Chrome

html_data = etree.HTML(page) a_list = html_data.xpath("//div[@class='box col3 ws_block']/a")
for a intps:' + a.xpath('./@href')[0]
resume_name = a.xpath('./img/@alt')[0]
import requests
from lxml import etree

headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:86.0) Gecko/20100101 Firefox/86.0', }

for i in range(2, 10): url = f'sc.chinaz.com/jianli/free…' # 设置相应的路由i

response = requests.get(url=url, headers=headers) html_data = etree.HTML(response.text) _list = html_data.xpath("//div[@class='box col3 ws_block']/a") for a in a_list: new_url = 'https:' + a.xpath('./@href')[0] name = a.xpath('./img/@alt')[0] res = requests.get(url=new_url) # 进入简历模板详情页面 resume_tree = etree.HTML(res.text) resume_url = resume_tree.xpath('//ul[@class="clearfix"]/a/@href')[0] result = requests.get(url=resume_url, headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:86.0) Gecko/20100101 Firefox/86.0'}).content # 获取二进制数据 path = './moban/' + name + '.rar'
with open(path, 'wb') as fp:
fp.write(result) # 保存文件