首页
首页
沸点
课程
直播
活动
竞赛
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
mantch
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
56
文章 56
沸点 0
赞
56
返回
|
搜索文章
最新
热门
【Model Log】模型评估指标可视化,自动画Loss、Accuracy曲线图工具,无需人工参与!
1. Model Log 介绍 Model Log 是一款基于 Python3 的轻量级机器学习(Machine Learning)、深度学习(Deep Learning)模型训练评估指标可视化工具,与 TensorFlow、Pytorch、PaddlePaddle结合使用,可…
BERT实现QA中的问句语义相似度计算
1. BERT 语义相似度 BERT的全称是Bidirectional Encoder Representation from Transformers,是Google2018年提出的预训练模型,即双向Transformer的Encoder,因为decoder是不能获要预测的信…
13.深度学习(词嵌入)与自然语言处理--HanLP实现
13. 深度学习与自然语言处理 前面已经讲过了隐马尔可夫模型、感知机、条件随机场、朴素贝叶斯模型、支持向量机等传统机器学习模型,同时,为了将这些机器学习模型应用于 NLP,我们掌握了特征模板、TF-IDF、词袋向量等特征提取方法。而这些方法的局限性表现为如下: 首先,传统的机器…
《自然语言处理入门》12.依存句法分析--提取用户评论
12. 依存句法分析 语法分析(syntactic parsing )是自然语言处理中一个重要的任务,其目标是分析句子的语法结构并将其表示为容易理解的结构(通常是树形结构)。同时,语法分析也是所有工具性NLP任务中较为高级、较为复杂的一种任务。 通过掌握语法分析的原理、实现和应…
11. HanLP实现朴素贝叶斯/SVM--文本分类
11. 文本分类 上一章我们学习了 文本聚类,体验了无须标注语料库的便利性。然而无监督学习总归无法按照我们的意志预测出文档的类别,限制了文本聚类的应用场景。有许多场景需要将文档分门别类地归人具体的类别中,比如垃圾邮件过滤和社交媒体的自动标签推荐。在这一章中, 我们将介绍如何实现…
10.HanLP实现k均值--文本聚类
10. 文本聚类 正所谓物以类聚,人以群分。人们在获取数据时需要整理,将相似的数据归档到一起,自动发现大量样本之间的相似性,这种根据相似性归档的任务称为聚类。 聚类(cluster analysis )指的是将给定对象的集合划分为不同子集的过程,目标是使得每个子集内部的元素尽量…
HanLP《自然语言处理入门》笔记--9.关键词、关键句和短语提取
9. 信息抽取 信息抽取是一个宽泛的概念,指的是从非结构化文本中提取结构化信息的一类技术。这类技术依然分为基于规则的正则匹配、有监督学习和无监督学习等各种实现方法。我们将使用一些简单实用的无监督学习方法。由于不需要标注语料库,所以可以利用海量的非结构化文本。 本章按照颗粒度从小…
8.HanLP实现--命名实体识别
8. 命名实体识别 文本中有一些描述实体的词汇。比如人名、地名、组织机构名、股票基金、医学术语等,称为命名实体。具有以下共性: 数量无穷。比如宇宙中的恒星命名、新生儿的命名不断出现新组合。 构词灵活。比如中国工商银行,既可以称为工商银行,也可以简称工行。 类别模糊。有一些地名本…
隐马尔可夫(HMM)/感知机/条件随机场(CRF)----词性标注
7. 词性标注 在语言学上,词性(Par-Of-Speech, Pos )指的是单词的语法分类,也称为词类。同一个类别的词语具有相似的语法性质,所有词性的集合称为词性标注集。不同的语料库采用了不同的词性标注集,一般都含有形容词、动词、名词等常见词性。下图就是HanLP输出的一个…
HanLP《自然语言处理入门》笔记--6.条件随机场与序列标注
6. 条件随机场与序列标注 本章介绍一种新的序列标注模型条件随机场。这种模型与感知机同属结构化学习大家族,但性能比感知机还要强大。为了厘清该模型的来龙去脉,我们先对机器学习模型做番柿理。然后结合代码介绍条件随机场理论,探究它与结构化感知机的异同。 根据建模的究竟是联合概率分布 …
下一页
个人成就
文章被点赞
237
文章被阅读
115,968
掘力值
2,643
关注了
7
关注者
4,654
收藏集
1
关注标签
2
加入于
2018-11-13