首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
fighting
掘友等级
nodejs
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
130
文章 17
沸点 113
赞
130
返回
|
搜索文章
最新
热门
自然语言处理之主题模型(四)
本文主要参考 Coursera上的 Natural Language Processing 课程。 主题模型是另一种理解语义(提取文章的主题、构建文章的向量表示)的方式。 主题 由一些 词 描述。 LDA(Latent Dirichlet Allocation)是一种文档主题生…
自然语言处理之语义理解(三)
本文章主要参考 吴恩达的深度学习课程和国立高等经济的选的自然语言处理课程。 上一篇文章中,讲述了如何使用 one-hot 代表单个词,以及使用 BoW 模型代表一个句子。其中有一个很大问题就是,BoW模型无法表示语义。 如果使用 BoW 模型,此时因为 猫和狗 是两个完全不同的…
自然语言处理之文本表示(二)
本文主要参考Coursera上 国立高等经济大学的自然语言处理课程 和 吴恩达老师的的机器学习课程。 one-hot 可以说是机器学习领域最常见的数据表示形式了。 还是以 上述内容为例,对于 我爱自然语言处理 这句话 tokenization 化之后得到了三个 one-hot …
自然语言处理之文本预处理(一)
本文主要参考Coursera上国立高等经济大学的自然语言处理课程。 ... token 可以是 字, 词, 段落 等等。 自然语言处理的第一步通常是 tokenization,即将 输入的文本(sequence)转换为 token 的过程。 eg. 使用 jieba 将一段文本…
个人成就
文章被点赞
3
文章被阅读
9,858
掘力值
172
关注了
32
关注者
5
收藏集
6
关注标签
34
加入于
2018-01-02