异常检测14

93 阅读3分钟

持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第14天,点击查看活动详情

Hello,非常感谢你的关注~ 我是机器学习与风控,一名末流985的本硕,无顶会、无大厂核心部门实习,拥有多个比赛的竞赛经历,秋招刷了leetcode500题,在秋招提前批中收获字节跳动,腾讯,阿里,美团等大厂offer,最终选择入职字节风控,从事与黑产对抗的工作。我会定期分享我的春招、秋招亲身求职体验;算法岗日常工作;数据挖掘比赛,经典图模型等日常学习等有料也有趣的内容~秋招到了,欢迎各位私信找我内推!

本章主要介绍融合属性信息的同构图异常检测技术,用以解决异常节点检测

场景中异常检测目标驱动性不足的问题以及任务无关的噪声边混合到邻域聚合过

程中带来的问题。首先在动机与主要贡献部分概述了已有方法的不足以及整体解

决思路,然后介绍了深度一分类异常检测算法作为本章的理论基础; 紧跟着,重点

介绍了提出的节点结构异常检测和节点的属性异常检测模块,介绍了如何充分利

用标签信息设计面向图异常节点检测场景的目标函数,以及如何利用属性异常检

测模块缓解异常检测的噪音边问题,最后通过相关实验验证了模型异常节点检测

的效果。

3.1 动机与主要贡献

异常检测一直是一个非常经典的任务,并且在在现实世界中的谣言检测,异常

行为检测等方面有着广泛的应用[55–57]。异常检测的一个广泛接受的定义是找到

与数据集中其他实例偏离的罕见实例。与此同时,随着现实世界中越来越多的场景

以图或网络的形式抽象表示,典型的例子包括社交网络、生物网络、交通网络和金

融交易网络。从这些场景中对图结构数据进行挖掘和分析引起了很多关注,其中,

图上的节点异常检测是一个至关重要的研究问题。例如,在金融交易网络中,识别

两个账户之间的异常(欺诈交易)至关重要,可以避免诸如洗钱诈骗等违法行为。

在社交网络中,检测异常用户节点(社交机器人)也很重要,因为它们可能会在社

交网络上传播谣言,影响用户社交体验,甚至危害社会安全。由于图中不仅包含复

杂的连接(结构)信息,节点本身还包含着丰富的属性信息,如何同时考虑结构信

息和属性信息去检测异常,这也为图上的异常检测带来了巨大的挑战。