持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第16天,点击查看活动详情
Hello,非常感谢你的关注~ 我是机器学习与风控,一名末流985的本硕,无顶会、无大厂核心部门实习,拥有多个比赛的竞赛经历,秋招刷了leetcode500题,在秋招提前批中收获字节跳动,腾讯,阿里,美团等大厂offer,最终选择入职字节风控,从事与黑产对抗的工作。我会定期分享我的春招、秋招亲身求职体验;算法岗日常工作;数据挖掘比赛,经典图模型等日常学习等有料也有趣的内容~秋招到了,欢迎各位私信找我内推!
本章首先分析了现有的深度异常检测技术存在无法处理图网络的复杂拓扑数
据以及目标驱动性不足的问题,针对上述问题,我们开发了一种融合属性信息的
半监督图异常节点检测技术,该方法将图结构与节点信息结合起来进行异常检测。
我们的方法一个核心在于提出了一个有标签情况下的基于图神经网络的面向异常
检测任务的损失函数,并且将半监督表示学习模块融入到异常检测过程中提升效
果。我们方法的另一个核心在于考虑了图神经网络以及噪音边对异常检测过程中
的影响,通过提出一个互补的属性异常检测模块进行补充,从而在考虑了属性异
常和结构异常的基础上来检测图中节点的最终异常。通过在五个真实数据集上的异常检测实验表明证明了我们方法的优越性。此外,我们进行了参数分析实验,实
验结果进一步表明:相比于仅利用属性信息或者结构信息,同时利用属性以及结
构信息进行异常检测的有效性;对比无监督异常检测方法,将半监督表示学习融
入到异常检测模块的有效性;对比单单从结构异常或者属性异常确定节点异常的
方法,本节提出的从结构异常以及属性异常的角度确定节点的异常可能性具有更
好的表现。正则化的影响(参数λ)为了分析正则化项的影响,我们报告了具有不同比例
标签样本下,当λ 为{0,0.001,0.005,0.01,0.05,0.1,0.5,1.0} 下的平均AUC 作为我们的实
验结果。如图3.4所示,我们提出的方法的获得最佳效果时候,λ 的值因数据集而
异。但是我们可以发现,无论在哪个数据集以及哪种标签比例下,我们的模型性能
始终在λ = 1 或λ = 10 处达到最佳效果。