首页
首页
沸点
课程
直播
活动
竞赛
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
云时之间
掘友等级
ML小萌新
|
我在这里学习和探索机器学习世界的奥秘
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
赞
1
文章 1
沸点 0
赞
1
返回
|
搜索文章
最新
热门
算法导论系列:分治算法
说起分治法,大家一定也都听过秦始皇采用郡县制将国家分为三十六郡的故事,我们常说”山高皇帝远”,意思就是山高路远,皇帝都管不了,实际上无论皇帝多远,山有多高,整个国家都属于朝廷统治,但皇帝一个人是管不了这么多事情的,那如何一统天下?秦始皇的郡县制其实就是分而治之的一种变种,我们现…
NLP系列学习:潜在语义牵引
这个模型的作用是通过海量的文献找出词汇的关系.就跟警察抓嫌疑人一样,犯罪事件在这个区域里出现的多了,这片区域越有可能成为犯罪的重点辖区. 词汇也是这样,当一些词汇大量出现在一篇文章里时,我们可以认为这篇文章会倾向去成为某一种类型,而这些词之间也存在着语义相关性. 1:聚类模型计…
文本分类中的一些小问题
这个问题可以说是我在实习阶段遇到的最大的坑吧. 自己的思路原本是使用CNN+字向量解决分类问题.然后通过选择卷积的宽度来去减少参数的规模,从而提升分类效果. 但是看到夕小瑶姐姐的回答,感觉自己的思路似乎有些问题.在笔直的道路上曲折前行.于是整理一下,方便日后尝试.
数字图像处理:直方图均衡化
首先在直方图的修整,有两种方法,一种是直方图均衡化,另外一种是直方图规定化,用起来的话第一种方法用的比较多,这里着重说一下第一种:直方图均衡化. 我们引入直方图,很大程度上是可以根据直方图的形态来去判断图像的质量,比如根据下图所示,会很快发现一张图片是过亮还是过暗,这篇文章会说…
NLP系列学习:DBOW句向量
用神经网络训练词向量的逻辑是,让网络去预测单词(目标词/上下文)这样的任务,句向量也是一样,我们给定从句子里的一些上下文,让网络去预测下一个单词。在句(Paragraph)向量模型中,每一个句子都被映射成一个独立的向量,这个句向量作为矩阵 D 的一列;同时,每一个词也被映射成一…
抛开复杂证明,我们从直觉上理解W-GAN为啥这么好训
关于GAN基础的知识,大家可以参考我另一篇生成对抗网络-GAN---一个好老师的重要性。 最关键的地方其实是D(X),即对整个H*W*C这个高维空间的评分系统,好不好训,最关键的地方其实是D(X)的打分是否是从G(X)(生成分布)的支撑集的低分逐渐升高到R(X)(真实分布)的支…
NLP系列学习:CRF条件随机场(1)
大家好,今天让我们来看看条件随机场,条件随机场是一项大内容,在中文分词里广泛应用,因为我们在之前的文章里将概率图模型和基本的形式语言知识有所了解,当我们现在再去学习条件随机场会容易比较多(在动笔写这篇文章前我也翻阅了很多的博客,发现很多博主上来就讲一大堆核心公式,而之前的铺垫知…
python学习之文章数据分析
英文文章一个好处是他们每个词之间会有空格来进行区分,但是词和词之间往往会有句号,逗号这样的标点来去干扰,因此我们是通过string这个模块来去除标点和空格,其中string.punctuation是去除标点,string.whitespace是去除空格.至于hist[word]…
NLP系列学习:前向算法和后向算法
在<CRF-tutorial>这一篇文章里,我们可以看到HMM经过发展之后是CRF产生的条件,因此我们需要学好隐马尔科夫模型. 在这一部分,我比较推荐阅读宗成庆老师的<自然语言处理>这本书,这一部分宗老师写的很不错,相关的资源在我之前的文章中已经上传,有兴趣的小伙伴可以阅读下.…
基于百度翻译的爬虫(二):页面篇
在这一篇文章里,我将通过一个开源的HTML页面再去进行修改,来达到我们的使用要求,最终的目的是学会我们如何使用网页,来达到自己的需求. 首先,我们的环境是Python3,并且之间会用web框架:tornado和request请求页面. 上边这些都是使用tornado的固定格式,…
下一页
个人成就
文章被点赞
88
文章被阅读
33,232
掘力值
820
关注了
16
关注者
35
收藏集
0
关注标签
35
加入于
2016-11-29