你居然不知道?一文了解 python 爬虫框架 Scrapy 的作者:Pablo Hoffman

512 阅读3分钟

前言

Scrapy 的老用户们对于这个工具的使用可能已经非常熟练了,但是很多人其实对这个爬虫框架的作者了解很少。

本篇文章,将会带大家认识一下这个神奇的爬虫框架的作者。

Scrapy 框架的作者

Scrapy 这个爬虫框架的创始人是出生在乌拉圭(翻了 Pablo 的个人博客才知道,一开始还以为是西班牙人...)的技术牛人:Pablo Hoffman 。

Pablo Hoffman 本人照片(来自他的 Linkedin 主页):

image.png

Pablo Hoffman 已经在技术领域从事了很多年,对创业有着极大的热情。Pablo 喜欢玩游戏(至少是早年的时候)[1],还喜欢看美剧《绝命毒师》,不过这部剧已经完结了。

他的个人博客的第一篇博文是自己写的一篇富含哲思的小诗,挺有意思的。

下图是他更年轻一点时的样子(照片来自 Pablo 的 github 主页):

image.png

感觉这么多年也没老多少,对吧。

关于 Pablo Hoffman

下面是 Pablo Hoffman 在自己的 Linkedin(领英,著名求职平台)主页上对自己工作经历的简介:

我从事开源工作已有 13 年,并且在我职业生涯的早期就对初创公司产生了兴趣。

2000年我加入了专注于高端视听解决方案的Ikatu公司,先后担任过系统管理员、软件工程师,最后成为公司的CIO。

2007 年,我离开 Ikatu 创办了 Insophia,这是我的第一家初创公司,也是第一家专门使用 Python 的乌拉圭公司,由于 OLPC 项目,这种语言在乌拉圭变得非常流行。

Insophia 最初是一家通用软件开发公司,在欧洲和美国拥有客户,然后随着 Scrapy 的流行专门从事网络爬虫,Scrapy 是我们在开发 Insophia 时创建并开源的网络爬虫框架。Scrapy 现在是 Python 事实上的网络爬虫框架。

2010 年,我创办了 Scrapinghub,这是一家在 Insophia 之前取得成功的基础上发展壮大的产品公司,专门致力于网络爬虫解决方案,包括专业服务和可扩展平台以运行网络爬虫。

在我过去的 3 年里,我一直致力于协调 Scrapy 的开源开发和扩展 Scrapinghub,从一家 3 人的公司发展到 70 名员工。

更多关于 Pablo Hoffman 履历信息,可以查看他的领英页面:es.linkedin.com/in/pablohof…

Pablo Hoffman 近况

如今的 Hoffman 正在经营自己的创立的一家数据采集公司 Zyte

对于 Zyte 提供的服务,本教程的后续也会有所探索和讲述,大家敬请期待!

最后

这里最后附上一段四年前(2023年开始算起) Pablo Hoffman 的采访视频,让大家对这位大佬有个稍稍更立体点的认识:vimeo.com/312979606

参考资料