一起养成写作习惯!这是我参与「掘金日新计划 · 4 月更文挑战」的第22天,点击查看活动详情
Hello,非常感谢你的关注~ 我是机器学习与风控,一名末流985的本硕,无顶会、无大厂核心部门实习,拥有多个比赛的竞赛经历,秋招刷了leetcode500题,在秋招提前批中收获字节跳动,腾讯,阿里,美团等大厂offer,最终选择入职字节风控,从事与黑产对抗的工作。我会定期分享我的春招、秋招亲身求职体验;算法岗日常工作;数据挖掘比赛,经典图模型等日常学习等有料也有趣的内容~秋招到了,欢迎各位私信找我内推!!!部门缺少开发,算法等岗位验证缺人。
异常检测是一个非常经典的任务,并且在在现实世界中的谣言检测,异常行为
检测等方面有着广泛的应用[42–44]。异常检测的一个广泛接受的定义是找到与数
据集中其他实例显着偏离的罕见实例,也就是在实际应用中,在整个数据集中正常
数据的数据量会远远小于异常数据的数据量。与此同时,随着现实世界中越来越
多的场景以图或网络的形式抽象表示,典型的例子包括社交网络、生物网络、交通
网络和金融交易网络。从这些场景中对图结构数据进行挖掘和分析引起了很多关
注,其中,图上的节点异常检测是一个至关重要的研究问题。例如,在金融交易网
络中,识别两个账户之间的异常(欺诈交易)至关重要,可以避免诸如洗钱诈骗等
违法行为。在社交网络中,检测异常用户节点(社交机器人)也很重要,因为它们
可能会在社交网络上传播谣言,影响用户社交体验,甚至造成社会动荡。由于图中
不仅包含复杂的链接(结构)信息,节点本身还包含着丰富的属性信息,如何同时
考虑结构信息和属性信息去检测异常,这也为图上的异常检测带来的巨大的挑战。
与此同时,在真实场景中,由于数据的表现形式是复杂的,因此对应的问题往
往被抽象为异构图中的异常节点检测。最近两年也出现了一系列半监督的深度学
习异常检测技术用于真实的异常检测场景。例如咸鱼平台提出的GAS[18] 算法运
用在了咸鱼平台的异常评论检测场景。该算法集成了异构和同构图来捕获评论的
局部上下文和全局上下文,将异常检测任务视作二分类任务,利用已知标签训练
模型,从而检测异常节点。GraphConsis[19] 研究了基于图的欺诈检测中的上下文、
特征和关系不一致问题,将异常检测任务视作二分类任务检测异常。CARE[20] 增
强了GNN 聚合过程,采用强化学习选择邻居的方式获得更好的节点表示,然后利
用交叉熵损失训练模型,进行欺诈评论检测。PC-GNN[21] 在CARE 的基础上,针
对异常检测中节点的类别不平衡问题做了采样,通过针对少数类别进行过采样缓
解不平衡问题,最后将异常检测任务视作二分类任务检测异常。