导语
哈喽!大家好。我是木木子吖~今天给大家带来爬虫的内容哈。
今天教大家Python爬虫实战一键采集大家喜欢的DJ舞曲哦!
DJ舞曲——美女热舞——好歌曲下载,还在等什么,赶紧来学习一下吧!
完整的源码💓免费自取👇👇厚台关注我滴滴我即可哦!
完整的源码💓免费自取👇👇厚台关注我滴滴我即可哦!
Ps——
XXDJ音乐是一款非常劲爆的摇滚节奏音乐软件,这里有着丰富的节奏音乐资源,各种各样的
DJ、舞曲、摇滚音乐都应有尽有,绝对能够更满足各位摇滚音乐爱好者们的喜好,让更多人学
习欣赏音乐、体验更刺激的音乐风格。
支持下载保存,让你可以免费收听,不需要使用数据流量也可以收听歌曲
陪你度过了很多无聊的时光,听歌让我们心情愉悦,随着歌摇摆吧;
所有你想听的DJ歌曲在这里,你可以在任何时候听到好的歌曲,听歌曲。快让我们马上行动起
来吧~采集某网站DJ舞曲!
正文
一、环境准备
1)运行环境
开发环境:Python3、Pycharm社区版、requests,部分自带的模块安装Python即可使用。
相对应的安装包/安装教程/激活码/使用教程/学习资料/工具插件 可以直接找我厚台获取 。
2)模块安装
第三方库的安装方式如下:
一般安装:pip install +模块名
镜像源安装:pip install -i pypi.douban.com/simple/+模块名
(还有很多国内镜像源,这里是豆瓣的用习惯了,其他镜像源可以去看下之前文章都有的)
模块安装问题可以详细的找我给大家讲一下的哈,之前其实也有的文章写了几个点的。
二、思路流程
1)确定采集XX某网站👇
url = 'http://www.36dj.com/xc/'
2)headers头文件
三、代码展示
1)主程序
import requests
url = 'http://www.36dj.com/xc/'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
id_list = re.findall('><a href="/play/(\d+)/" title=', response.text)
for index in id_list:
link = f'http://www.36dj.com/play/{index}/'
response_1 = requests.get(url=link, headers=headers)
response_1.encoding = response_1.apparent_encoding
mp3_info = re.findall('var music_name = "(.*?)"; var info = \{ "playurl": "(.*?)"', response_1.text)
title = mp3_info[0][0]
# http://tn1.72djapp.cn:8399/2022/3606/23t/16394.m4a
mp3_url = 'http://tn1.72djapp.cn:8399/' + mp3_info[0][1]
mp3_content = requests.get(url=mp3_url, headers=headers).content
with open('mp3\\' + title + '.mp3', mode='wb') as f:
f.write(mp3_content)
print(title, mp3_url)
2)效果展示
总结
今日分享到此结束!别忘了“三连”哦!咱们下期不见不散!