Google开源的高维数据可视化工具,通过特定的降维算法如PCA,T-sne将原始数据降维到二或者三维空间,以 2D 或 3D 模式查看数据,通过自然的拖拽手势,实现缩放、旋转、固定等操作。
在 可视化网站 上放出了一个单独的版本,用户无需安装和运行TensorFlow,即可将其高维数据可视化。
网上介绍很多,我直接说说如何使用:


但是要求输入的数据是tsv格式,tsv与csv的区别就在于tsv以\t分隔,csv以,分隔,所以我们需要把pandas.dataframe保存成tsv格式,方式如下:
with open("./my.tsv", 'w') as write_tsv:
write_tsv.write(df.to_csv(sep='\t', index=False,header=False))
2.在上图的位置2中加载label,(可以是每个词向量对应的任一属性)
将dataframe中的某一属性保存成单独的tsv即可:
with open("./feature1.tsv", 'w') as write_tsv:
write_tsv.write(df['feature1'].to_csv(sep='\t', index=False,header=False))
然后就可以看3D可视化结果了,可以看出根据feature1的分布情况看出聚类效果如何:

也可以看2D的效果:

个人感觉看聚类的时候蛮好用的,不用自己code实现了。