Doc2Vec入门demo

425 阅读1分钟

看了这个不完善的demo,它最后效果不算好,因为预处理不够。

应该先分词、去除停用词等再进行Taggeded格式去训练。

Doc2Vec主要是将文本(句子or文章)进行向量转换,将文本转换成一系列向量,之后可以送到机器学习模型中去预测情感啊、计算商品相似度啊...诸如此类的。

https://blog.csdn.net/juanjuan1314/article/details/75124046/

以上为demo链接,可以非正式地学习一下。博主的留言下有数据集。

感谢!