首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
NLP
尤而小屋
创建于2023-01-28
订阅专栏
分享自然语言处理相关知识
等 1 人订阅
共14篇文章
创建于2023-01-28
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
Twitter数据的文本分析
导入库 https://www.kaggle.com/code/errearanhas/topic-modelling-lda-on-elon-tweets/notebook In [1]: 导入数据
基于神经网络推理的单词分布式表示
大家好,我是Peter~ 1 单词的分布式表示:基于推理的方法 基于计数的方法会根据一个单词周围的单词的出现次数来表示该单词:生成共现矩阵、再对共现矩阵实施SVD降维,最终获得密集向量(单词的分布式表
NLP模型之-skip-gram模型
大家好,我是Peter~ 本文首先介绍如何从概率角度看待CBOW模型,再从CBOW模型延伸到skip-gram模型。 1 从概率角度看CBOW模型 概率的表示方法: P(A):事件A发生的概率 P(A
基于NLP的主题预测建模
大家好,我是Peter~ 更新一篇机器学习实战项目:NLP任务之主题建模,主要内容包含: 数据探索性分析 文本信息的词云图展示 文本预处理(分词、去除停用词、词干提取、词性还原、文本向量化) 基于LD
基于NLTK的文本清理
大家好,我是Peter~ 本文是《NLTK基础教程-用NLTK和Python库构建机器学习应用》的学习笔记,主要讲解的是文本歧义及其清理。 1 文本歧义及清理 文本歧义是指从原生数据中获取一段机器可读
基于NLP实现文本分类聚类和主题建模
1 实现文本分类、聚类分类和主题建模 分类和聚类:基于scikit-learn库 主题建模:基于gensim库 数据使用的是从UCI官网下载的数据:https://archive.ics.uci.ed
NLTK基础教程:文本歧义及清理
大家好,我是Peter~ 本文是《NLTK基础教程-用NLTK和Python库构建机器学习应用》的学习笔记,主要讲解的是文本歧义及其清理。 1 文本歧义及清理 文本歧义是指从原生数据中获取一段机器可读
神经网络基础:从零实现全连接网络
大家好,我是Peter~ 本文给大家介绍深度学习神经网络中的基础知识: 向量、矩阵和多维数组 神经网络基础 激活函数 全连接网络从零实现 数学和Python基础 在神经网络中,向量和矩阵是随处可见的。
基于LDA的Twitter数据分析
本文介绍一个LDA数据分析的项目,使用的是一份Twitter数据集 导入库 导入数据 数据预处理 不同year对比 语料处理 准备文本列表 准备好语料库corpus: 停用词处理stopwords d
ChatGPT注册教程!
最近ChatGPT真的是太火了,朋友圈铺天盖地的新闻。ChatGPT的确强,很多人都想玩玩。但是都无法注册没有账号,今天小编教你如何快速注册
ChatGPT:情人节我是懂的!
大家好,我是Peter~ ChatGPT教你情人节该怎么做。 情人节怎么来的 首先我们看看情人节到底怎么来的: 遇到喜欢的女生,怎么做? 男生该怎么做? 情人节快到了,男生到底该做什么? 情人节表白选
自然语言处理鱼书笔记3-基于计数方法的改进
大家好,我是Peter~ 本文记录的是书籍《深度学习进阶:自然语言处理》的第三章学习笔记。 基于统计方法函数 在这里先回顾下基于统计的计数方法: 预处理 共现矩阵 相似度计算 相似单词的降序 调用函数
自然语言处理鱼书笔记2-单词的分布式表示
大家好,我是Peter~ 本文记录的是书籍《深度学习进阶:自然语言处理》的第二章学习笔记。 同义词词典 介绍NLP中的词典问题。 特点 NLP中常用的不是《新华字典》,而是一种被称为同义词词典的词典
自然语言处理鱼书笔记1-神经网络推理
大家好,我是Peter~ 本文记录的是书籍《深度学习进阶:自然语言处理》的第一章学习笔记。 这本书简称为鱼书,朋友推荐的NLP经典书籍。后面会陆续更新读书笔记。 神经网络推理 表示输入层的数据,、表示