python爬虫模拟登录CSDN

1,775 阅读3分钟

​​**这是我参与8月更文挑战的第22天,活动详情查看:8月更文挑战**​

目录

1、页面分析

2、引入selenium模块及驱动

1、并将安装好的Chromedriver.exe引入到代码中

2、谷歌浏览器驱动引入

3、切换到账号密码登录

4、找到用户名密码的控件ID

5、注入用户名和密码

6、模拟登录点击

7、成功登录CSDN

1、页面分析

CSDN登录页面如下图

2、引入selenium模块及驱动

1、并将安装好的Chromedriver.exe引入到代码中

# -*- coding:utf-8 -*-
from selenium import webdriver  
import os
import time
#引入chromedriver.exe
chromedriver="C:/Users/lex/AppData/Local/Google/Chrome/Application/chromedriver.exe"
os.environ["webdriver.chrome.driver"] = chromedriver
browser = webdriver.Chrome(chromedriver)

2、谷歌浏览器驱动引入

驱动下载地址:

download.csdn.net/download/we…

将驱动下载后,复制chromedriver.exe 到谷歌浏览器的安装路径下,与Chrome.exe启动文件并列的目录下:

3、切换到账号密码登录

使用selenium模拟点击 账号密码登录的选项

#使用selenium选择 账号登录按钮
browser.find_element_by_link_text("账号密码登录").click()

4、找到用户名密码的控件ID

5、注入用户名和密码

根据页面代码分析,获得用户名的id属性为all,密码的id属性为password-number

使用python代码,注入用户名密码

browser.find_element_by_id("all").clear()
browser.find_element_by_id("all").send_keys("xxxx@gmail.com")
time.sleep(2)
browser.find_element_by_id("password-number").clear()
browser.find_element_by_id("password-number").send_keys("1212121212")

6、模拟登录点击

分析页面结构,模拟点击登录按钮。

分析可获得,登录按钮的class属性为btn btn-primary,根据class来锁定该按钮

time.sleep(1)
#增加一秒钟的时间间隔
browser.find_element_by_class_name("btn btn-primary").click()

7、成功登录CSDN