首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
关键词提取
订阅
用户7872882975613
更多收藏集
微信扫码分享
微信
新浪微博
QQ
11篇文章 · 0订阅
中文分词、文本的数学表示和相似度计算
这是我参与11月更文挑战的第5天,活动详情查看:2021最后一次更文挑战 在日常生活中,我们经常会看到聊天机器人的应用,比如线上淘宝客服,微信自动回复,线下店铺机器人接待等。聊天机器人可以帮助我们从重
如何用Python提取中文关键词?
本文一步步为你演示,如何用Python从中文文本中提取关键词。如果你需要对长文“观其大略”,不妨尝试一下。 好友最近对自然语言处理感兴趣,因为他打算利用自动化方法从长文本里提取关键词,来确定主题。 他向我询问方法,我推荐他阅读我的那篇《如何用Python从海量文本提取主题?》。…
如何用 Python 和 gensim 调用中文词嵌入预训练模型?
利用 Python 和 Spacy 尝试过英文的词嵌入模型后,你是不是很想了解如何对中文词语做向量表达,让机器建模时捕捉更多语义信息呢?这份视频教程,会手把手教你操作。 写过《如何用Python处理自然语言?(Spacy与Word Embedding)》一文后,不少同学留言或私…
python开源组件:gensim
0/总结 1/前言 2/基本概念 3/语料库(文档库)的预处理 4/主题向量的变换 5/文档相似度的计算 构造LSI模型并将待检索的query和文本转化为LSI主题向量 转换之前的corpus和que
Python自然语言处理:NLTK与Gensim库
Python中的NLTK和Gensim是两个常用的自然语言处理(NLP)库。它们各自提供了不同的工具和功能,可以帮助我们处理文本数据并提取有意义的信息。 NLTK(Natural Language T
Gensim训练模型 词向量的保存与调用
Gensim是一款开源的第三方Python工具包,用于从原始的非结构化的文本中,无监督地学习到文本隐层的主题向量表达。支持包括TF-IDF, LSA, LDA, Word2Vec在内的多种主题模型算法,支持分布式训练,提供了相似度计算、信息检索等一些常用的API接口。 上述算法…
使用Gensim进行主题建模(一)
主题建模是一种从大量文本中提取隐藏主题的技术。Latent Dirichlet Allocation(LDA)是一种流行的主题建模算法,在Python的Gensim包中具有出色的实现。然而,挑战在于如何提取清晰,隔离和有意义的高质量主题。这在很大程度上取决于文本预处理的质量以及…
使用Gensim进行主题建模:Python中的实践指南
一、引言 Gensim是一款开源的Python库,用于自然语言处理和信息检索。它主要的功能包括主题建模和文档相似度分析,这些功能使得Gensim成为文本处理和机器学习任务的强大工具。在本文中,我们将介
自然语言处理之主题模型(四)
本文主要参考 Coursera上的 Natural Language Processing 课程。 主题模型是另一种理解语义(提取文章的主题、构建文章的向量表示)的方式。 主题 由一些 词 描述。 LDA(Latent Dirichlet Allocation)是一种文档主题生…
探索主题建模:使用LDA分析文本主题
在数据分析和文本挖掘领域,主题建模是一种强大的工具,用于自动发现文本数据中的隐藏主题。Latent Dirichlet Allocation(LDA)是主题建模的一种常用技术。本文将介绍如何使用Pyt