在这篇文章中,我们将学习如何在Selenium中访问和打开网页的URLs。Python Selenium是一个强大的工具,用于以编程方式操纵网络浏览器。它兼容所有的浏览器,在所有主要的操作系统上运行,它的脚本可以用各种语言编写,包括Python、Java、C#等。其中我们将用Python来工作。
Selenium Python绑定提供了一个直接的API,用于访问Selenium WebDrivers,如Firefox、Internet Explorer、Chrome、Remote和其他。目前Selenium支持2.7、3.5和更高版本的Python。
下面给出的代码样本一定会帮助你在Python中打开网页的URLs。
使用Selenium打开URLs
现在让我们来学习如何在Python Selenium中访问网页和打开URLs。这是使用Selenium的最基本要求。一旦你理解了这一点,你只需要玩玩XPaths,并确定如何使用你用Python Selenium搜刮的数据
1.安装Python Selenium
我们将使用pip 命令来安装 selenium 包。
python -m pip install selenium
2.导入模块
现在让我们在我们的Python代码中导入selenium模块,开始使用它。
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
driver = webdriver.Chrome('./chromedriver.exe')
注意:现在我们已经安装了Selenium,但是为了访问开放的网络浏览器并使它们能够被我们的代码访问,我们需要下载浏览器的官方驱动并注意它的路径
这里我们给出的路径是'./chromedriver.exe',因为我们把驱动程序放在了与Python脚本相同的目录中,如果你把它保存在其他地方,那么你就必须提供它的完整路径。
3.打开URL的例子
Python Selenium中的URL是用selenium模块的get() 方法打开或获取的。
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
driver = webdriver.Chrome('./chromedriver.exe')
driver.get("https://www.google.com")
driver.close()
这将在一个新的测试浏览器窗口中打开Chrome中的谷歌网站。
close()方法被用来关闭浏览器窗口。
4.网页的标题
我们可以通过使用下面的python命令在我们的控制台/终端窗口中以文本输出的方式获得所打开的网页的标题。
print(driver.title)
5.在谷歌上搜索一个查询
语法: site/search?q='topic to search'(搜索主题)。
这将在新的窗口中显示Chrome浏览器中Google搜索中关于python的结果。
driver.get("https://www.google.com/search?q =Python")
6.在浏览器历史记录中前后移动
Back驱动在浏览器历史记录中向后退一步。
语法:driver.back()
前进驱动在浏览器历史记录中前进一步
语法:driver.forward()
实施示例:
from selenium import webdriver
driver = webdriver.Chrome("./chromedriver.exe")
# opens Google
driver.get("https://www.google.com")
# open python official website
driver.get("https://www.python.org")
现在,首先Google会在一个新窗口中打开,然后在同一窗口中打开Python官方网站,并在Google网站上打开。
driver.back()
# will go to Google
driver.forward()
# will go to python official website
你需要在后退和前进方法之间使用类似time.sleep(5)的东西来真正注意到这个过渡。
总结
希望你已经学会了使用Selenium库在Python中打开网页的URLs,并准备自己尝试一下。