boss 爬虫,加速找工作

251 阅读1分钟

最近需要找工作了。行情不好,开发脚本协助投递。

功能

  • 爬取列表职位信息
  • 爬取数据写入sqlite3数据库
  • 过滤已拉取职位
  • 为数据标记是否已投递
  • 自动投递

安装

pip3 install selenium

表结构

保存职位信息表

类型备注
idint主键
job_nametext工作名
company_nametext公司名
salarytext薪资
detail_urltext沟通链接
uniq_urltext岗位唯一值
create_timedatetime获取职位时间
statusint岗位状态,1:入库,2:已沟通 3: 待沟通

使用

  • 获取职位
python3 joblist.py| tee out.txt
  • 标记已投递建立
python3 modify_status.py
  • 查看未投递职位
    使用 sqlitebrowser 打开数据库,筛选状态为3的工作。决定是否沟通。并修改岗位的状态为已投递,即status修改为2。

sqlite3 客户端

ubuntu 系统下,按张sqlite3 客户端


sudo add-apt-repository -y ppa:linuxgndu/sqlitebrowser
sudo apt-get install sqlitebrowser
sqlite3 db.sqlite3

注意

使用测试号爬职位链接。用正式号打开职位链接投递。

项目 github 地址

boss爬虫