如何在Selenium中打开网页的URLs

1,031 阅读3分钟

在这篇文章中,我们将学习如何在Selenium中访问和打开网页的URLs。Python Selenium是一个强大的工具,用于以编程方式操纵网络浏览器。它兼容所有的浏览器,在所有主要的操作系统上运行,它的脚本可以用各种语言编写,包括Python、Java、C#等。其中我们将用Python来工作。

Selenium Python绑定提供了一个直接的API,用于访问Selenium WebDrivers,如Firefox、Internet Explorer、Chrome、Remote和其他。目前Selenium支持2.7、3.5和更高版本的Python。

下面给出的代码样本一定会帮助你在Python中打开网页的URLs。

使用Selenium打开URLs

现在让我们来学习如何在Python Selenium中访问网页和打开URLs。这是使用Selenium的最基本要求。一旦你理解了这一点,你只需要玩玩XPaths,并确定如何使用你用Python Selenium搜刮的数据

1.安装Python Selenium

我们将使用pip 命令来安装 selenium 包。

python -m pip install selenium

2.导入模块

现在让我们在我们的Python代码中导入selenium模块,开始使用它。

from selenium import webdriver
from selenium.webdriver.common.keys import Keys

driver = webdriver.Chrome('./chromedriver.exe')

注意:现在我们已经安装了Selenium,但是为了访问开放的网络浏览器并使它们能够被我们的代码访问,我们需要下载浏览器的官方驱动并注意它的路径

这里我们给出的路径是'./chromedriver.exe',因为我们把驱动程序放在了与Python脚本相同的目录中,如果你把它保存在其他地方,那么你就必须提供它的完整路径。

3.打开URL的例子

Python Selenium中的URL是用selenium模块的get() 方法打开或获取的。

from selenium import webdriver
from selenium.webdriver.common.keys import Keys
driver = webdriver.Chrome('./chromedriver.exe')

driver.get("https://www.google.com")
driver.close()

这将在一个新的测试浏览器窗口中打开Chrome中的谷歌网站。

close()方法被用来关闭浏览器窗口。

4.网页的标题

我们可以通过使用下面的python命令在我们的控制台/终端窗口中以文本输出的方式获得所打开的网页的标题。

print(driver.title)

5.在谷歌上搜索一个查询

语法: site/search?q='topic to search'(搜索主题)。

这将在新的窗口中显示Chrome浏览器中Google搜索中关于python的结果。

driver.get("https://www.google.com/search?q =Python")

6.在浏览器历史记录中前后移动

Back驱动在浏览器历史记录中向后退一步。

语法:driver.back()

前进驱动在浏览器历史记录中前进一步

语法:driver.forward()

实施示例:

from selenium import webdriver

driver = webdriver.Chrome("./chromedriver.exe")

# opens Google
driver.get("https://www.google.com")

# open python official website
driver.get("https://www.python.org")


现在,首先Google会在一个新窗口中打开,然后在同一窗口中打开Python官方网站,并在Google网站上打开。

driver.back()
# will go to Google

driver.forward()
# will go to python official website


你需要在后退和前进方法之间使用类似time.sleep(5)的东西来真正注意到这个过渡。

总结

希望你已经学会了使用Selenium库在Python中打开网页的URLs,并准备自己尝试一下。