如何在linux系统中运行使用selenium的python脚本

368 阅读1分钟
  1. 查看Google Chrome是否已安装:

    which google-chrome

    如果未安装,对于CentOS/Fedora:

    sudo yum install https://dl.google.com/linux/direct/google-chrome-stable_current_x86_64.rpm

  2. 查看Chrome版本,以下载合适版本的chromedriver:

    google-chrome --version

  3. 下载对应版本的chromedriver:

    进入下载chromedriver的网站,找到应该下载的链接并右键复制链接,替换下面的命令:

    sudo wget http://chromedriver.storage.googleapis.com/113.0.5672.63/chromedriver_linux64.zip

  4. 解压下载后的压缩文件,解压后删除压缩包:

    sudo unzip chromedriver_linux64.zip

    sudo rm chromedriver_linux64.zip

    为 ChromeDriver 二进制文件授予执行权限:

    sudo chmod +x chromedriver

  5. 准备好python环境,安装依赖等:

    sudo apt-get install python3

    sudo apt-get install python3.8 (可指定版本) 安装各种需要的依赖(示例):

    pip install selenium loguru schedule

    pip install elasticsearch==7.10.0 # ES版本指定

  6. 切到想放代码的路径,并运行以下代码创建一个新的.py文件:

    nano your_script_name.py

    创建后进入文本编辑器,复制代码粘贴进去,注意chromedriver的path要是本机driver的路径,Ctrl + X退出,按Y保存,最后按回车确认文件名称。

  7. terminal中运行代码(先切到脚本文件的路径)

    python get_website_linux.py

  8. 如果想终止执行定时任务,在该窗口Ctrl+C就可以利用KeyboardInterrupt终止执行;

    如果当前窗口关闭,程序在后台运行,在新的终端窗口中,先列出所有正在运行的进程并筛选python进程:

    ps aux | grep python

    找到你想终止的进程的ID,并运行以下命令终止该进程:

    kill 12345