-
查看Google Chrome是否已安装:
which google-chrome如果未安装,对于CentOS/Fedora:
sudo yum install https://dl.google.com/linux/direct/google-chrome-stable_current_x86_64.rpm -
查看Chrome版本,以下载合适版本的chromedriver:
google-chrome --version -
下载对应版本的chromedriver:
进入下载chromedriver的网站,找到应该下载的链接并右键复制链接,替换下面的命令:
sudo wget http://chromedriver.storage.googleapis.com/113.0.5672.63/chromedriver_linux64.zip -
解压下载后的压缩文件,解压后删除压缩包:
sudo unzip chromedriver_linux64.zipsudo rm chromedriver_linux64.zip为 ChromeDriver 二进制文件授予执行权限:
sudo chmod +x chromedriver -
准备好python环境,安装依赖等:
sudo apt-get install python3或sudo apt-get install python3.8(可指定版本) 安装各种需要的依赖(示例):pip install selenium loguru schedulepip install elasticsearch==7.10.0 # ES版本指定 -
切到想放代码的路径,并运行以下代码创建一个新的.py文件:
nano your_script_name.py创建后进入文本编辑器,复制代码粘贴进去,注意chromedriver的path要是本机driver的路径,Ctrl + X退出,按Y保存,最后按回车确认文件名称。
-
terminal中运行代码(先切到脚本文件的路径)
python get_website_linux.py -
如果想终止执行定时任务,在该窗口Ctrl+C就可以利用KeyboardInterrupt终止执行;
如果当前窗口关闭,程序在后台运行,在新的终端窗口中,先列出所有正在运行的进程并筛选python进程:
ps aux | grep python找到你想终止的进程的ID,并运行以下命令终止该进程:
kill 12345