是将每个数据根据相似的属性或特征划分到每个特定的数据集中,然而
问题与经典聚类问题有很大的不同,因为没有关于地址的直接信息,如坐标或距离,所以我们需要利用区块链内部的交易规则来采用三种启发式算法对地址进行聚类。
以下聚类方法以比特币为例(不考虑混币技术)
启发式1:多输入交易的账户地址聚类

启发式2:创币交易的账户地址聚类

(1)创世交易中存在多个输出地址,则认为所有的输出地址由同一实体控制。
启发式3:找零交易的账户地址聚类

(1)输出地址中的找零地址是第一次出现;
(2)交易不是一个创世交易;
(3)出现在输入地址中的地址没有出现在输出地址中;
(4)输出地址中只有一个找零地址,且至少有两个输出地址。