首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
NLP
订阅
小巫debug日记
更多收藏集
微信扫码分享
微信
新浪微博
QQ
13篇文章 · 0订阅
如何使用中文维基百科语料
在做自然语言处理时很多时候都会需要中文语料库,高质量的中文语料库较难找,维基百科和百度百科算是比较不错的语料库。其中维基百科会定时将语料库打包发布 https://dumps.wikimedia.org/zhwiki/ ,可以下载最新版本的语料库。而百度百科则需要自己去爬,不过…
全栈 - 17 NLP 使用jieba分词处理文本
这是全栈数据工程师养成攻略系列教程的第十七期:17 NLP 使用jieba分词处理文本。 我们对NLP是什么和做什么,以及和NLP领域相关的内容和应用有了一个大致的概览,现在让我们通过Python中的
直白介绍卷积神经网络(CNN)
卷积神经网络(也称作 ConvNets 或 CNN)是神经网络的一种,它在图像识别和分类等领域已被证明非常有效。 卷积神经网络除了为机器人和自动驾驶汽车的视觉助力之外,还可以成功识别人脸,物体和交通标志。
CNN on TensorFlow
在 TensorFlow 官方的 tutorials 中,我们使用 softmax 模型在 MNIST 数据集上得到的结果只有 91% 的正确率,实在太糟糕。所以,我们将使用一个稍微复杂的模型:CNN(卷积神经网络)来改善实验效果。
使用Tensorflow训练循环神经网络语言模型
读了将近一个下午的TensorFlow Recurrent Neural Network教程,翻看其在PTB上的实现,感觉晦涩难懂,因此参考了部分代码,自己写了一个简化版的Lanugage Model,思路借鉴了Keras的LSTM text generation。
干货 | 深度学习在文本分类中的应用
文本分类是自然语言处理的一个基本任务,试图推断出给定的文本(句子、文档等)的标签或标签集合。 文本分类的应用非常广泛。如: 让AI当法官: 基于案件事实描述文本的罚金等级分类(多分类)和法条分类(多标签分类)。 ...... 二分类:accuracy,precision,rec…
NLP入门+实战必读:一文教会你最常见的10种自然语言处理技术(附代码)
自然语言处理(NLP)是一种艺术与科学的结合,旨在从文本数据中提取信息。在它的帮助下,我们从文本中提炼出适用于计算机算法的信息。从自动翻译、文本分类到情绪分析,自然语言处理成为所有数据科学家的必备技能之一。 我有几张阿里云幸运券分享给你,用券购买或者升级阿里云相应产品会有特惠惊…
达观数据基于Deep Learning的中文分词尝试
1. 自然语言处理(NLP,Natural Language Processing)是一个信息时代最重要的技术之一,简单来讲,就是让计算机能够理解人类语言的一种技术。在其中,分词技术是一种比较基础的模块。对于英文等拉丁语系的语言而言,由于词之间有空格作为词边际表示,词语一般情况…
正则化方法:Dropout
Dropout是一种常见的正则化方法。它借用了集成学习的思想,近似实现了同时训练大量网络结构,并通过集成得出预测结果的功能。由于含有集成环节,Dropout可以有效地避免过拟合。 Dropout要解决的问题是:在同一个神经网络模型中,有没有可能通过一定的手段模拟出多个网络模型的…