使用pyppeteer淘宝登录

1,241 阅读1分钟
原文链接: zhuanlan.zhihu.com

使用pyppeteer淘宝登录,获取Cookies

现在淘宝的商品搜索页必须要登录才能见,所以必须要cookies才能进行下一步操作。本期介绍如何使用pyppeteer登录淘宝,获取Cookies。

pyppeteer介绍

地址:https://github.com/miyakogi/pyppeteer

介绍:Unofficial Python port of puppeteer JavaScript (headless) chrome/chromium browser automation library.非官方的chrome浏览器,前身是JavaScript的puppeteer

安装:python3 -m pip install pyppeteer

打开网站并截图

import asyncio
from pyppeteer import launch


async def main():
    browser = await launch()
    page = await browser.newPage()
    await page.goto('https://zhangslob.github.io/')
    await page.screenshot({'path': 'zhangslob.png'})
    await browser.close()
asyncio.get_event_loop().run_until_complete(main())

第一次运行时需要下载Chromium,你可以提前在终端输入pyppeteer-install来下载。

登录淘宝

整体逻辑很简单:

  1. 设置pyppeteer启动项,打开一个浏览器
  2. 打开淘宝登录页面
  3. 修改浏览器属性
  4. 输入账号密码
  5. 滑动滑块
  6. 登录

代码太长,可以直接去Github上看,记得要加上自己的账号密码。记得要用小号,如果长时间使用一个账号,会出现各种各样的验证。

所有代码在AwesomeCrawler/taobao_login

如何建立Cookie池

必须多个账号,那么如何注册多个淘宝账号呢。。

  1. 可以通过第三方提供手机号验证码服务商,通过pyppeteer注册账号,保存账号信息
  2. 登录账号并保存在redis
  3. 开线程检查账号是否已过期,若过期重新登录即可