异常检测12

218 阅读3分钟

持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第12天,点击查看活动详情

Hello,非常感谢你的关注~ 我是机器学习与风控,一名末流985的本硕,无顶会、无大厂核心部门实习,拥有多个比赛的竞赛经历,秋招刷了leetcode500题,在秋招提前批中收获字节跳动,腾讯,阿里,美团等大厂offer,最终选择入职字节风控,从事与黑产对抗的工作。我会定期分享我的春招、秋招亲身求职体验;算法岗日常工作;数据挖掘比赛,经典图模型等日常学习等有料也有趣的内容~秋招到了,欢迎各位私信找我内推!

异常检测一直是一个非常经典的任务,并且在在现实世界中的谣言检测,异常

行为检测等方面有着广泛的应用[55–57]。异常检测的一个广泛接受的定义是找到

与数据集中其他实例偏离的罕见实例。与此同时,随着现实世界中越来越多的场景

以图或网络的形式抽象表示,典型的例子包括社交网络、生物网络、交通网络和金

融交易网络。从这些场景中对图结构数据进行挖掘和分析引起了很多关注,其中,

图上的节点异常检测是一个至关重要的研究问题。例如,在金融交易网络中,识别

两个账户之间的异常(欺诈交易)至关重要,可以避免诸如洗钱诈骗等违法行为。

在社交网络中,检测异常用户节点(社交机器人)也很重要,因为它们可能会在社

交网络上传播谣言,影响用户社交体验,甚至危害社会安全。由于图中不仅包含复

杂的连接(结构)信息,节点本身还包含着丰富的属性信息,如何同时考虑结构信

息和属性信息去检测异常,这也为图上的异常检测带来了巨大的挑战。 根据异常检测任务中异常标签难以获得的特点,在过去的几年,出现了一系列

用于无监督异常检测的技术。一类无监督异常检测方法专注于欧几里德数据(例

如图像、表格和文本)的异常检测。由于数据集中异常节点的数目远远少于正常节

点的数目,因此大部分方法通过对正常数据进行建模,从而将那些不符合该模式

的节点视为异常节点。例如,[11, 58, 59] 将异常检测问题转化到一分类问题,只针

对正常数据建模,从而将不属于正常类别模式的数据识别为异常。但是这类方法

只考虑了属性信息而缺乏对结构信息的建模,无法较好的适用于图异常检测任务。

根据图异常检测任务中复杂的结构信息以及节点属性信息特点,另一类同时考虑

结构信息和属性信息的图异常检测方法[45–47] 开始兴起。该类图异常检测技术将

图自编码器作为模型的主要结构,首先利用基于图神经网络的图编码器同时捕捉

节点的属性和结构信息,然后利用解码器解码出输入数据。正如2.2.1所述,该类技

术主要的基本假设是认为图自编码器在通过编码器和解码器进行重构数据的时候

能够捕捉正常数据的分布,网络难以学习异常数据的模式,但是这类方法的目标

是学习低维节点嵌入,不直接针对异常检测,使得该类方法针对异常检测任务的

内在驱动性不足。