功能强大的python包:selenium(自动化浏览器机器人)

89 阅读5分钟

元素定位

| 元素定位 | 代码实现 |

| --- | --- |

| id定位 | find_element_by_id( )、find_element(By.ID,'id') |

| name定位 | find_element_by_name( )、find_element(By.NAME,'name') |

| class定位 | find_element_by_class_name( )、find_element(By.CLASS_NAME,'class_name') |

| link定位 | find_element_by_link_text( )、find_element(By.LINK_TEXT,'link_text') |

| tag定位 | find_element_by_tag_name( )、find_element(By.TAG_NAME,'tag_name') |

| xpath定位 | find_element_by_xpath( )、find_element(By.XPATH,'xpath') |

| css定位 | find_element_by_css( )、find_element(By.CSS,'css') |

浏览器操作

浏览器操作是针对浏览器客户端的一些操作,如我们常用的最大化、最小化等。

image

| 浏览器操作 | 代码实现 |

| --- | --- |

| 最大化 | browser.maximize_window( ) |

| 最小化 | browser.minimize_window( ) |

| 设置窗口大小 | browser.set_window_size( ) |

| 前进 | browser.forword( ) |

| 后退 | browser.back( ) |

| 刷新 | browser.refresh( ) |

操作测试对象

操作测试对象是我们在自动化测试中常用的一些方法,主要是对定位到的元素进行操作。

image

| 操作测试对象 | 代码实现 |

| --- | --- |

| 点击对象 | click( ) |

| 模拟按键输入 | send_keys( ) |

| 清除对象内容 | clear( ) |

| 提交对象内容 | submit( ) |

| 获取元素文本信息 | text( ) |

键盘事件

在操作测试对象中,send_keys( )中可以传递键盘事件,相当于我们按下一下特殊的按键。

键盘事件

| 键盘事件 | 代码实现 |

| --- | --- |

| TAB | send_keys(Keys.TAB) |

| ENTER | send_keys(Keys.ENTER) |

| BackSpace | send_keys(Keys.BackSpace) |

| Space | send_keys(Keys.Space) |

| Esc | send_keys(Keys.Esc) |

| F1 | send_keys(Keys.F1) |

| F12 | send_keys(Keys.F12) |

| 全选 | send_keys(Keys.CONTROL,'a') |

| 复制 | send_keys(Keys.CONTROL,'c') |

| 剪切 | send_keys(Keys.CONTROL,'x') |

| 粘贴 | send_keys(Keys.CONTROL,'v') |

鼠标事件

鼠标事件能够用于执行所有鼠标能够完成的操作。

鼠标事件

| 鼠标事件 | 代码实现 |

| --- | --- |

| 执行ActionChains中的操作 | perform( ) |

| 右击 | content_click( ) |

| 双击 | double_click( ) |

| 拖动 | drag_and_drop( ) |

| 鼠标悬停 | move_to_element( ) |

窗口、框架切换

当打开多个网页时,利用窗口、框架切换方法可以切换显示网页。

窗口切换

获取断言信息

image

cookie操作

3.selenium应用于爬虫

selenium应用于爬虫,主要是为了解决scrapy无法解决的问题:获取JavaScrapt渲染后的页面HTML代码。

在之前讲解scrapy库的文章中,我们了解到引擎于爬虫之间存在一个下载器中间件,scrapy就是通过这种下载器中间件来下载网页源码的;但面对JavaScrapt渲染的网页,这个下载器中间件就无能为力了,这时selenium就起到了替代下载器中间件的作用。

selenium在爬虫中的主要应用流程如下图:

image

"""苏宁易购查找iphone"""

from selenium.webdriver.common.keys import Keys

from selenium.webdriver.common.by import By

from selenium.webdriver.support import expected_conditions as EC

from selenium.webdriver.support.wait import WebDriverWait

from selenium import webdriver

driver = webdriver.Edge(executable_path='msedgedriver.exe')

driver.get('www.suning.com')

input = driver.find_element_by_id('searchKeywords')

input.clear

input.send_keys('iphone')

input.send_keys(Keys.RETURN)

wait = WebDriverWait(driver,10)

wait.until(EC.presence_of_element_located((By.CLASS_NAME,'root990')))

print(driver.page_source)

"""自动下拉页面"""

from selenium import webdriver

import time

driver = webdriver.Edge(executable_path='msedgedriver.exe')

driver.get('www.suning.com/')

time.sleep(4)

input = driver.find_element_by_id('searchKeywords')

input.clear

input.send_keys('iphone')

input.send_keys(Keys.RETURN)

driver.execute_script('window.scrollTo(0,document.body.scrollHeight)')

"""定位元素"""

from selenium import webdriver

driver = webdriver.Edge(executable_path='msedgedriver.exe')

driver.get('www.suning.com/')

input_id = driver.find_element_by_id('searchKeywords')

input_name = driver.find_element_by_name('index1_none_search_ss2')

input_xpath = driver.find_element_by_xpath("//input[@id='searchKeywords']")

input_css = driver.find_element_by_css_selector('#searchKeywords')

print(input_id,input_name,input_xpath,input_css)

"""等待页面加载完成"""

from selenium import webdriver

from selenium.common.exceptions import TimeoutException

driver = webdriver.Edge(executable_path='msedgedriver.exe')

#设置页面加载的超时时间

driver.set_page_load_timeout(5)

文末有福利领取哦~

👉一、Python所有方向的学习路线

Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。img

👉二、Python必备开发工具

img
👉三、Python视频合集

观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
img

👉 四、实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。(文末领读者福利)
img

👉五、Python练习题

检查学习结果。
img

👉六、面试资料

我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。
img

img

👉因篇幅有限,仅展示部分资料,这份完整版的Python全套学习资料已经上传

了解详情:docs.qq.com/doc/DSnl3ZG…