AI造谣、数据被爬……恶意爬虫流量创下历史新高,我们能做些什么?

42 阅读7分钟

从移动支付到智能驾驶、从社交应用到掌上服务平台,我们每天都在网络空间进行信息交互。每一次的身份授权和信息录入,虽然便捷了我们的日常生活,却也让个人信息与隐私数据泄漏风险愈发凸显。一旦被恶意爬取,就有可能引发精准诈骗、身份盗用等事件。对于掌握大量用户信息的企业而言,如何高效抵御这些恶意爬虫,守护企业和用户的关键资产安全,是企业谋求长远发展必须练好的“内功” 。那么,恶意爬虫问题究竟有多严重?我们又该如何应对?

一、恶意爬虫的发展现状

自动化爬虫流量占全球网络流量的51% ,十年来首次超过业务产生的正常流量。

恶意爬虫流量占全球网络流量的37% ,连续六年呈现上升趋势。

图片

这些“流氓程序”模仿人类行为执行盗窃和欺诈等犯罪行为,不仅扭曲行业生态,更对企业的运营及数字资产安全构成持续威胁。

在航空业,恶意爬虫会向网站大量发送虚假搜索请求,导致搜索量虚高却没有实际预订行为,从而歪曲访问预订率这一关键指标,而该指标对于航空公司预测需求、制定价格和做出合理商业决策至关重要。

零售业是第二大受爬虫攻击的行业,主要威胁包括抢购、凭证填充攻击、分布式拒绝服务攻击(DDoS)等。这些攻击在节日购物季节尤为频繁,不仅干扰正常运营,还导致收入损失、客户信任受损以及基础设施成本上升。

此外,金融服务和医疗保健行业因高度依赖API处理关键业务和敏感交易,成为账户接管(ATO)等高级爬虫攻击的重点目标。API数量激增也扩大了攻击面,使网络犯罪分子能借助身份验证和授权机制的漏洞实施账户接管和数据盗窃。

随之而来的经济损失亦呈指数级放大。根据Marsh McLennan网络风险情报中心为Imperva进行的一项研究,易受攻击的API与自动化爬虫攻击每年给企业造成高达1860亿美元的损失。然而,对于企业来说,损失远不止于销售额下降。若未能有效防御攻击,还可能面临监管罚款。在欧盟,企业若未能主动防范爬虫发起的ATO攻击,最高可能被处以公司年度全球营业额的4%或2000万欧元(以较高者为准)的罚款。

二、技术不是问题,滥用才是问题

你知道吗?爬虫并非天生有害。所谓的爬虫或称机器人(Bot),指的是一种在线自动执行任务的软件程序。这些任务往往繁琐、重复且乏味,人工执行耗时较长。以航班预订为例,当我们访问一个预订网站并输入搜索条件后,爬虫的工作就是在幕后默默抓取多个航班网站的信息并快速呈现给我们。

爬虫之所以存在,归根结底是因为数字经济的高度互联性,以及允许软件程序访问第三方系统的API的广泛使用。互联网设计之衷就是为了实现这种“网络效应”,但遗憾的是,这种开放性也为恶意行为者提供了可乘之机。

图片

正所谓技术不是问题,滥用才是问题。作为一种算法技术,爬虫一旦被滥用,就会出现散播垃圾信息、制造虚假点击、冒充真人用户、实施凭证攻击、兑现盗窃资产等自动化威胁。

恶意爬虫攻击之所以如此难防,是因为这些恶意操作者无不在进行迭代。他们采用多种复杂技术来规避检测,例如模拟人类鼠标移动轨迹和点击行为,有些攻击采取“低频慢速”的策略——通过极少的请求分散执行攻击,从而避开传统防御系统的监测。

与此同时,生成式AI和大语言模型的发展,使非技术用户也能轻松编写代码,发动简单的恶意爬虫攻击,并“助推”技术用户快速生产更加复杂的代码,发动高级的恶意爬虫攻击。据统计,2024年,Imperva每天平均拦截超过200万次由AI驱动的网络攻击——平均每秒就会发动23次拦截

三、防止网络爬虫变“害虫”

图片

恶意爬虫流量水涨船高,企业与网络安全专家正全面升级防御,以减轻其带来的影响。总结了九条应对策略,帮助企业“扬善除恶”:

识别风险

用流量分析 + 实时爬虫检测工具 + 多因素身份验证(MFA)来识别潜在风险,网站、应用、API接口需逐一排查。

保护暴露的API与移动应用

API和应用是访问敏感数据的通道,也因此成为高风险点。企业应执行最严格的身份验证机制和访问控制策略,防止访问令牌滥用和数据被非法爬取。

拦截过时浏览器

大量爬虫UA仍停留在旧版浏览器,而大多数真实用户都会更新到最新版本。因此,阻止过时浏览器的访问,可以有效拦截大量恶意爬虫流量。

识别可疑代理

爬虫常用代理隐藏真实来源。企业可以通过限制已知批量数据中心的大批量IP访问,防止“隐身流量”的攻击。

发现异常模式

网站跳出率高、转化率低、流量突然异常上升、单一URL请求激增……这些都是潜在的恶意爬虫活动信号。

实时监测登录流量

拉齐对正常的失败登录尝试的认知,并设置实时监控及预警机制。一旦出现异常波动(短时段内失败次数飙升)系统应立即发出提醒。

部署MFA

攻击者常会购买被泄露的账户凭证,用于凭证填充和ATO攻击。企业应及时了解泄露事件,并通过MFA增强登录安全,防止凭证滥用。

评估综合防护方案

恶意爬虫越来越擅长规避传统检测手段,因此企业需要构建多层次防护体系,包括用户行为分析、身份画像和设备指纹识别等方式。

动态调整防御策略

一口气亮出全部防御底牌只会让对手学会变强,并绕过防护。企业可以在关键时刻(如新品发布、促销活动等)动态调整策略,让攻击者措手不及。 结语

结语:筑牢网络安全防线

爬虫并非“全员恶人”,但现实是,其中近三分之二属于恶意类型。这些爬虫对当今的数字环境构成重大威胁,给企业和消费者带来严重破坏。但值得欣慰的是,企业并非毫无还手之力。德迅云安全部署的T级别数据中心,具备完善的机房设施,核心骨干网络有效保证高品质的网络环境和丰富的带宽资源。搭载赠送:自主化管理平台、德迅卫士(主机安全防火墙)、Web云防护(一站式网站安全加速)、1V1专家技术支撑,竭诚为您提供安全、可靠、稳定、高效的服务体验。提供面向未来的技术手段和本土化解决方案,帮助各行各业有效应对恶意爬虫攻击。让我们携手筑牢网络安全的第一道防线,让互联网带来的便捷服务惠及更多人。