区块链地址启发式聚类算法

1,496 阅读1分钟

  \color{red}{经典聚类算法}是将每个数据根据相似的属性或特征划分到每个特定的数据集中,然而\color{blue}{区块链地址聚类}问题与经典聚类问题有很大的不同,因为没有关于地址的直接信息,如坐标或距离,所以我们需要利用区块链内部的交易规则来采用三种启发式算法对地址进行聚类。

以下聚类方法以比特币为例(不考虑混币技术)

启发式1:多输入交易的账户地址聚类

(1)如果一个交易有两个及以上的输入地址,则认为所有输入地址都由同一实体控制。

启发式2:创币交易的账户地址聚类

(1)创世交易中存在多个输出地址,则认为所有的输出地址由同一实体控制。

启发式3:找零交易的账户地址聚类

符合以下特征的即为找零地址,可认为其与输入地址由同一实体控制:

(1)输出地址中的找零地址是第一次出现;

(2)交易不是一个创世交易;

(3)出现在输入地址中的地址没有出现在输出地址中;

(4)输出地址中只有一个找零地址,且至少有两个输出地址。