数据集介绍

134 阅读2分钟

持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第15天,点击查看活动详情

Hello,非常感谢你的关注~ 我是机器学习与风控,一名末流985的本硕,无顶会、无大厂核心部门实习,拥有多个比赛的竞赛经历,秋招刷了leetcode500题,在秋招提前批中收获字节跳动,腾讯,阿里,美团等大厂offer,最终选择入职字节风控,从事与黑产对抗的工作。我会定期分享我的春招、秋招亲身求职体验;算法岗日常工作;数据挖掘比赛,经典图模型等日常学习等有料也有趣的内容~秋招到了,欢迎各位私信找我内推!

我们评估了三组异常检测方法以证明我们方法的有效性:即“仅用属性”、“仅

用结构”和“同时使用属性和结构”的方法。“仅用属性”的方法仅利用节点属性信

息来检测异常,我们选择OC-SVM[58]、Deep-SVDD[11]、DSAD[12] 和NN 作为该

大类的比较方法。“仅用结构”的方法仅考虑结构信息而忽略属性信息,我们选择

具有代表性的DeepWalk[18] 方法作为该大类的方法。“同时使用属性和结构”的方

法同时捕获节点属性和结构以检测异常,我们将较新的Dominant[47]、SLGCN[2]

和SADAG[51] 作为该大类的方法。详细描述如下。

  1. OC-SVM[58] 试图找到一个将所有正常实例放在一侧而异常值位于另一侧的

超平面,通过计算节点与超平面的位置关系检测异常。

  1. Deep-SVDD[11] 通过训练深度神经网络以学习一个包围节点嵌入的最小超

球体的体积检测异常。

  1. DSAD[12] 是一种从Deep-SVDD 扩展的半监督异常检测方法,它使用标记和

未标记的实例来学习最小超球体。该算法也是通过计算节点和超球体中心的

距离检测异常。

  1. NN 是利用属性的前馈神经网络分类器。通过深度神经网络编码属性信息获

得向量表示后,通过交叉熵损失来训练参数。

  1. DW[18] 通过保持图结构特性无监督学习阶段表示。在学习到节点的嵌入表

示向量后,我们使用逻辑回归进行异常检测。

  1. Dominant[47] 是一种无监督的属性图异常检测方法。它使用图卷积神经网

络去编码属性和结构信息,然后去重构节点的属性和邻居,将每个重构损失

视为该节点的异常分数。