Selenium+Python刷B站视频播放量

1,116 阅读1分钟

我正在参加「掘金·启航计划」

一、需导入的第三方库

需要导入的库有:

  • selenium:用于控制浏览器的库
  • sqlite3:用于操作数据库的库
  • time:用于暂定程序的库
  • random:用于生成随机数据的库
  • math:用于进行数学计算的库 image.png

二、创建数据库

  • sqlite数据库
  • 数据库表url_table包含字段:url_id(记录id)、url_content(视频网址)、url_title (视频标题)、url_duration (视频时长)、url_owner (视频作者id)

image.png

三、获取全部url

  • 创建Chrome对象
  • 根据用户id从用户空间第一页获取用户空间视频分页的页数
  • 获取用户空间第一页的所有视频信息(视频aid、视频时长、视频标题)
  • 用户除了空间第一页的全部视频信息(视频aid、视频时长、视频标题)
  • 最后返回视频信息

image.png

四、将全部url导入到数据库中

  • 将获取到用户视频信息(视频网址、视频时长、视频标题、用户id)存入到数据库中

image.png

五、从数据库中获取视频url

  • 从数据库中获取用户id为up_id的所有视频信息 (视频网址、视频时长、视频标题)
  • 最后返回视频信息 (视频网址、视频时长、视频标题)

image.png

六、随机浏览视频

  • 从视频信息列表中随机获取视频播放,随机获取视频play_times个,每个视频播放sleep_time秒

image.png