python爬虫——爬取房天下

66 阅读3分钟

soup = BeautifulSoup(req.get(url).text,"html.parser")

resinfo = soup.select(".tab-cont-right .trl-item1")

获取户型、建筑面积、单价、朝向、楼层、装修情况

for re in resinfo:

tmp = re.text.strip().split("\n")

name = tmp[1].strip()

if("朝向" in name):

name = name.strip("进门")

if("楼层" in name):

name = name[0:2]

if("地上层数" in name):

name = "楼层"

if("装修程度" in name):

name = "装修"

info[name] = tmp[0].strip()

xiaoqu = soup.select(".rcont .blue")[0].text.strip()

info["小区名字"] = xiaoqu

zongjia = soup.select(".tab-cont-right .trl-item")

info["总价"] = zongjia[0].text

return info

domain = "esf.anyang.fang.com/"

city = "house/"

#获取总页数

def getTotalPage():

res = req.get(domain+city+"i31")

soup = BeautifulSoup(res.text, "html.parser")

endPage = soup.select(".page_al a").pop()['href']

pageNum = endPage.strip("/").split("/")[1].strip("i3")

print("loading.....总共 "+pageNum+" 页数据.....")

return pageNum

分页爬取数据

def pageFun(i):

pageUrl = domain + city + "i3" +i

print(pageUrl+" loading...第 "+i+" 页数据.....")

res = req.get(pageUrl)

soup = BeautifulSoup(res.text,"html.parser")

houses = soup.select(".shop_list dl")

pageInfoList = []

for house in houses:

try:

print(domain + house.select("a")[0]['href'])

info = getHouseInfo(domain + house.select("a")[0]['href'])

pageInfoList.append(info)

print(info)

except Exception as e:

print("---->出现异常,跳过 继续执行",e)

df = pd.DataFrame(pageInfoList)

return df

connect = create_engine("mysql+pymysql://root:root@localhost:3306/houseinfo?charset=utf8")

for i in range(1,int(getTotalPage())+1):

学好 Python 不论是就业还是做副业赚钱都不错,但要学会 Python 还是要有一个学习规划。最后大家分享一份全套的 Python 学习资料,给那些想学习 Python 的小伙伴们一点帮助!

一、Python所有方向的学习路线

Python所有方向路线就是把Python常用的技术点做整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。

二、学习软件

工欲善其事必先利其器。学习Python常用的开发软件都在这里了,给大家节省了很多时间。

三、全套PDF电子书

书籍的好处就在于权威和体系健全,刚开始学习的时候你可以只看视频或者听某个人讲课,但等你学完之后,你觉得你掌握了,这时候建议还是得去看一下书籍,看权威技术书籍也是每个程序员必经之路。

四、入门学习视频

我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了。

五、实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

六、面试资料

我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。

了解详情:docs.qq.com/doc/DSnl3ZG…