【Python实战】激情澎湃,2023极品劲爆舞曲震撼全场,爬虫一键采集DJ大串烧,一曲DJ舞曲,人人都听醉~(排行榜采集)

311 阅读2分钟

导语

哈喽!大家好。我是木木子吖~今天给大家带来爬虫的内容哈。

今天教大家Python爬虫实战一键采集大家喜欢的DJ舞曲哦!

DJ舞曲——美女热舞——好歌曲下载,还在等什么,赶紧来学习一下吧!

完整的源码💓免费自取👇👇厚台关注我滴滴我即可哦!

完整的源码💓免费自取👇👇厚台关注我滴滴我即可哦!

Ps——

XXDJ音乐是一款非常劲爆的摇滚节奏音乐软件,这里有着丰富的节奏音乐资源,各种各样的

DJ、舞曲、摇滚音乐都应有尽有,绝对能够更满足各位摇滚音乐爱好者们的喜好,让更多人学

习欣赏音乐、体验更刺激的音乐风格。

支持下载保存,让你可以免费收听,不需要使用数据流量也可以收听歌曲

陪你度过了很多无聊的时光,听歌让我们心情愉悦,随着歌摇摆吧;

所有你想听的DJ歌曲在这里,你可以在任何时候听到好的歌曲,听歌曲。快让我们马上行动起

来吧~采集某网站DJ舞曲!

正文

一、环境准备

 1)运行环境 

 开发环境:Python3、Pycharm社区版、requests,部分自带的模块安装Python即可使用。 

 相对应的安装包/安装教程/激活码/使用教程/学习资料/工具插件 可以直接找我厚台获取 。 

 2)模块安装 

 第三方库的安装方式如下: 

 一般安装:pip install +模块名 

 镜像源安装:pip install -i pypi.douban.com/simple/+模块名 

 (还有很多国内镜像源,这里是豆瓣的用习惯了,其他镜像源可以去看下之前文章都有的) 

 模块安装问题可以详细的找我给大家讲一下的哈,之前其实也有的文章写了几个点的。 

二、思路流程

1)确定采集XX某网站👇

url = 'http://www.36dj.com/xc/'

2)headers头文件

三、代码展示

1)主程序

import requests

url = 'http://www.36dj.com/xc/'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
id_list = re.findall('><a href="/play/(\d+)/" title=', response.text)
for index in id_list:
    link = f'http://www.36dj.com/play/{index}/'
    response_1 = requests.get(url=link, headers=headers)
    response_1.encoding = response_1.apparent_encoding
    mp3_info = re.findall('var music_name = "(.*?)"; var info = \{ "playurl": "(.*?)"', response_1.text)
    title = mp3_info[0][0]
    # http://tn1.72djapp.cn:8399/2022/3606/23t/16394.m4a
    mp3_url = 'http://tn1.72djapp.cn:8399/' + mp3_info[0][1]
    mp3_content = requests.get(url=mp3_url, headers=headers).content
    with open('mp3\\' + title + '.mp3', mode='wb') as f:
        f.write(mp3_content)
    print(title, mp3_url)


2)效果展示

总结

今日分享到此结束!别忘了“三连”哦!咱们下期不见不散!

完整的源码💓免费自取👇👇厚台关注我滴滴我即可哦!

往期还有更多内容等你来学习啦~