#-*-coding:utf-8-*-
import urllib, pymysql, requests, re
# 配置数据库
config = {
'host': '127.0.0.1',
'port': 3306,
'user': 'root',
'password': '******',
'db': 'weibo',
'charset': 'utf8',
}
# 链接数据库
conn = pymysql.connect(**config)
cursor = conn.cursor()
# 获取热搜源码
weiboHotFile = requests.get('http://s.weibo.com/top/summary')
weiboHotHtml = weiboHotFile.text
# 正则表达式匹配URL,找到title
hotKey = re.compile(r'td class=\\"td_05\\"><a href=\\"\\/weibo\\/(.*?)&Refer=top\\"')
hotKeyListBe = hotKey.findall(weiboHotHtml)
rank = 1
# 遍历获取的title列表
for title in hotKeyListBe:
# 去除干扰数字
title = title.replace('25', '')
url = 'http://s.weibo.com/weibo/' + title
title = urllib.parse.unquote(title)
print(str(rank)+' '+title + ' '+' '+url+'\n')
# 执行数据语句
sql = 'insert into hotsearch (rank, daydate, mindate, title, url) values (%s, curdate(), curtime(), %s, %s)'
cursor.execute(sql, (rank, title, url))
rank += 1
conn.commit()
cursor.close()
conn.close()
最后,如果你的时间不是很紧张,并且又想快速的提高,最重要的是不怕吃苦,建议你可以联系维:mengy7762 ,那个真的很不错,很多人进步都很快,需要你不怕吃苦哦!大家可以去添加上看一下~