异常检测11

131 阅读4分钟

持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第11天,点击查看活动详情

Hello,非常感谢你的关注~ 我是机器学习与风控,一名末流985的本硕,无顶会、无大厂核心部门实习,拥有多个比赛的竞赛经历,秋招刷了leetcode500题,在秋招提前批中收获字节跳动,腾讯,阿里,美团等大厂offer,最终选择入职字节风控,从事与黑产对抗的工作。我会定期分享我的春招、秋招亲身求职体验;算法岗日常工作;数据挖掘比赛,经典图模型等日常学习等有料也有趣的内容~秋招到了,欢迎各位私信找我内推!

虽然该文提出的算法在半监督的背景下对图上节点进行了异常检测,但是该

文仅仅使用图卷积神经网络去提取特征,没有考虑不同的节点贡献度以及图神经

网络的平滑问题。

与此同时,在真实场景中,由于数据的表现形式是复杂的,因此对应的问题

往往被抽象为异构图中的异常节点检测。最近两年也出现了一系列半监督的深度

学习异常检测技术用于真实的异常检测场景,而且由于异常检测的本质是判别一

个实例是否是异常,二分类的算法也可用在异常检测场景中。例如咸鱼平台提出

的GAS[9] 算法运用在了咸鱼平台的异常评论检测场景。该算法针对数据稀疏问题,

集成了异构和同构图来捕获评论的局部上下文和全局上下文,将异常检测任务视

作二分类任务,利用已知标签训练模型,从而检测异常节点。欺诈节点会把自己伪

装成正常节点,GraphConsis[13] 研究了基于图的欺诈节点检测中的上下文、特征

和关系不一致问题,最终将异常检测任务视作二分类任务检测异常。CARE-GNN[6]

增强了GNN 聚合过程,采用强化学习选择邻居的方式获得更好的节点表示,然后

利用交叉熵损失训练模型,进行欺诈评论检测。PC-GNN[7] 在CARE-GNN 的基础

上,针对异常检测中节点的类别不平衡问题做了采样,通过针对少数类别进行过采样缓解不平衡问题,最后将异常检测任务视作二分类任务检测异常。虽然这一

类技术[6, 7, 9, 13] 取得了先进效果,但是这些技术往往针对了某类问题进行了改

进,例如GAS[9] 针对的是图数据稀疏问题,PC-GNN[7] 针对的是类别不平滑问题,

CARE-GNN 以及GraphConsis[6, 13] 针对的欺诈节点的伪装问题,这些方法缺少了

对以上问题的同时考虑,这也促进了本文第五章的工作。 本章围绕深度学习的图异常检测技术调研,梳理了图异常节点检测的预备知

识,对深度异常节点检测算法从两大类进行了综述性梳理。第一类图异常节点检测

方法用图表示学习抽取节点特征后再进行异常检测,表示学习作为关键一环,严

重影响后续表现,因此,本章详细介绍了表示学习现状;第二类图异常节点检测方

法中从联合学习的角度进行异常检测,本章介绍了相关技术以及存在的部分不足。

两大类技术内容对深度图异常节点检测相关知识进行了系统性的介绍,阐明了本

文后续工作从图表示学习以及从联合学习的角度将深度学习技术用于提高异常节

点检测性能的方向的动机。