关于对用户进行聚类的方法

275 阅读1分钟

前言

按照已有的用户特征,对于全域的用户进行聚类这件事情,有很好的业务价值,能够帮助指导公司进行更搞笑的用户运营策略;

而为了让最终的用户聚类能够有很好的效果,需要有很科学的评估手段和计算方法;

目前已知的聚类方法分为一下几类:

  1. 用图的方式,把用户关系行为映射到一张图上
    1. 通过GNN的方式对图数据进行聚类
    2. 把GNN网络进行Embedding,得到每个用户的向量,再用kmeans来进行聚类
  2. 通过LLM + kmeans的方式 3. 通过把用户基础特征,按照文本的方式构造成一个数据集,让llm 词嵌入进行向量化;最终使用kmeans进行聚类

Reference

towardsdatascience.com/mastering-c…