持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第13天,点击查看活动详情
Hello,非常感谢你的关注~ 我是机器学习与风控,一名末流985的本硕,无顶会、无大厂核心部门实习,拥有多个比赛的竞赛经历,秋招刷了leetcode500题,在秋招提前批中收获字节跳动,腾讯,阿里,美团等大厂offer,最终选择入职字节风控,从事与黑产对抗的工作。我会定期分享我的春招、秋招亲身求职体验;算法岗日常工作;数据挖掘比赛,经典图模型等日常学习等有料也有趣的内容~秋招到了,欢迎各位私信找我内推!
上述方法推进了异常检测的研究,但是仍有改进之处。第一,深度自编码器的
目标是学习低维节点嵌入,不直接针对异常检测,使得该类方法针对异常检测任
务的内在驱动性不足。第二,这些方法都只是在无监督场景下进行异常检测,除了
许多未标记的实例外,我们还可以在实际应用中访问少量的标记实例,例如通过
领域专家验证的带有标签的实例子集。第三,虽然图神经网络由于其同质性假设
在同时处理图的结构信息和属性信息有着比较好的优势,但是在异常检测场景下,
该同质性假设会导致异常节点的表示难以区分。例如,一个异常节点和周围四个
正常节点具有边的关系,由于图神经网络模型的同质性假设,通过图神经网络会
使得该异常节点的表示和正常节点的表示过于接近,使得难以学习到异常节点的
有效信息,不利于异常节点检测任务。针对上述内容提出的传统的异常检测技术以及基于图自编码器的图异常检测技术存在的问题,该章提出了融合属性信息的同构图异常节点检测算法。首先,针
对基于图自编码的异常检测技术的目标驱动性不足的特点,我们在利用图神经网
络提取特征的基础上设计了一个半监督的面向异常检测任务的损失函数用于检测
节点的结构异常。同时,为了充分利用有限的标记数据,我们将半监督表示学习纳
入到异常检测任务中,帮助编码器提取到质量好的特征,以便进行后续任务。最
后,为了缓解由于图神经网络的同质性假设以及任务无关的噪声边混合到邻域聚
合中,我们构建了一个对称的深度神经网络从属性的角度去检测属性异常,作为
节点结构异常的补充。另外,本章从实际应用出发设计图异常检测数据集,在五个
真实数据集上验证我们模型的效果,通过消融实验探究了各个模块的影响。