金融防诈骗预测科研小班

165 阅读2分钟

科学家已经开发了严格的机器学习(ML)和分析模型来检测欺诈。 然而,大多数数据科学模型忽略了一些至关重要的东西:网络结构

社会网络分析研究突出了分析网络结构的预测能力。 正如詹姆斯·福勒(James Fowler)在《Connected》一书中所说,“我们越来越多地了解到,通过从朋友和朋友的朋友那里获得所有信息,你可以对人们做出更好的了解,而不是从你自己所掌握的关于这个人的信息中获得更好的了解。”

网络分析和捕捉数据元素之间的内在联系。 我们习惯于把社交网络数据看作一个图,但事实上,任何类型的数据都可以用这种方式表示。 例如,可以将帐户持有人及其信息可视化为一个图。分析账户持有人信息的网络结构时,可能会看到(如下图所示)多个账户持有人的电话号码相同或识别号码相同。 共享相同的个人信息可能表明共用身份欺诈。 这些类型的欺诈的痕迹很难被发现,除了图算法之外,没有一种有效的方法来检查成千上万甚至数百万账户持有人的庞大网络结构。

表格式数据模型,以行和列组织数据,不是为了捕捉数据中固有的复杂关系和网络结构而设计的,将数据构建为一个图,便于我们揭示和使用它的结构进行分析和预测,通过使用图形数据库,我们可以将这些网络结构持久化存储,以便以后进行分析。 pan.baidu.com/s/11YJIw6Mt…