引言
在商业信息查询领域,“T眼查”和“Q查查”以其全面的数据和便捷的服务成为业界的领头羊。然而,尽管它们的服务备受赞誉,会员套餐的价格却让不少用户望而却步。以“T眼查”为例,360元的年费对于非高频用户来说,性价比并不高。媒体单位和个人在进行市场调研或产品推广时,往往不需要如此高频率的企业信息查询服务。
需求背景
- 用户对企业信息查询的普遍需求
企业信息查询对于市场分析、产品推广和风险评估至关重要。用户需要获取企业的详细联系方式,以便进行商务沟通或合作洽谈。
- 共享会员的局限性和使用场景
共享会员账号虽然提供了一种成本较低的查询方式,但其批量导出次数的限制使得这一解决方案并不完美。用户在需要大量数据时,常常面临无法导出的窘境。
- 用户对一次性查询和批量导出的需求
许多用户,尤其是进行产品推广或市场调研的个人或企业,他们对企业信息的查询是偶发性的,但当需要时,又希望能够快速、批量地获取所需数据。
为啥做这个工具
开发这款工具的初衷源于我在商业实践中遇到的一个实际问题。就在昨天,我有一项迫在眉睫的任务:寻找一系列外贸企业的客户联系方式,以便推广我们的产品。目前也没找到合适的工具,所有就亲自操刀。
于是,我决定运用Automa这一强大的自动化工具来解决这个问题。通过Automa,我设计并实现了一个自动化流程,能够快速定位并抓取所需的企业联系信息,主打一个高效。
开发流程清单
-
天眼查会员版批量导出联系方式 工作流程图
-
演示视频
第一步:写一个判断元素是否存在,我们需要下载的几个参数,
这里我选择了三个参数。
第二步:参数选择之后,定义三个变量,存储三个css 。
而且这个三个css都是批量的,也就是可以全选的。这个非常重要,这里每一页都是20个数据,我没有使用循环的方式,而且采用的多选,这样效率高一些。
第三步:那么这个批量的css是怎么来的呢
第四步:在前面加一个判断,确定我们需要采集的元素是存在的。
第五步:一页的数据采集之后,需要点击下一页,这里找到下一页的点击元素即可。这里没有用到循环,所有效率是非常快的,按照3-5秒采集一个网页。按照200页数据4000条记录去算的话,大概10-16分钟就全部采集了。
技术细节
css找元素 是所有关键的核心
小结
具体的工作流执行,里面的内容还是非常多的,这个方式慎用,本篇文章仅做记录分享。 如果你喜欢这个文章,也喜欢Automa这个平台可以给你公司,或者你现在的项目带去帮助。 欢迎交流 大鱼社区:hanspaul.site \/信:sc18662470897