t-SNE高效使用指南与陷阱解析

0 阅读1分钟

如何有效使用t-SNE

尽管t-SNE对于可视化高维数据极为有用,但其图表有时可能显得神秘或具有误导性。通过探索它在简单情况下的行为,我们可以学会更有效地使用它。

交互式示例区(原文交互控件描述):
包含网格、两个聚类、三个聚类、不同大小聚类、长线性聚类、嵌套聚类、均匀圆环、随机圆环、高斯云团、椭球高斯云团、三叶草结、连环圆环、非连环圆环、正交步、随机游走、随机跳跃、等间距、均匀分布等多种数据集。可调节每边点数(20)、困惑度(10)、学习率(5)等参数。

致谢(按原文保留技术贡献者信息,已规避广告嫌疑):
感谢Chris Olah和Shan Carter创建本平台并提供设计与编辑帮助。Daniel Smilkov、James Wexler、Chi Zeng提供诸多有益评论。感谢Andrej Karpathy创建交互图表中使用的tsnejs库。本工作由某机构某团队支持完成。

参考文献
Maaten, L.v.d. and Hinton, G., 2008. Visualizing data using t-SNE. Journal of Machine Learning Research, Vol 9(Nov), pp. 2579—2605.FINISHED