首页
AI Coding
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
ai
订阅
松直
更多收藏集
微信扫码分享
微信
新浪微博
QQ
7篇文章 · 0订阅
如何使用 scikit-learn 为机器学习准备文本数据
文本数据需要特殊处理,然后才能开始将其用于预测建模。 我们需要解析文本,以删除被称为标记化的单词。然后,这些词还需要被编码为整型或浮点型,以用作机器学习算法的输入,这一过程称为特征提取(或矢量化)。 scikit-learn 库提供易于使用的工具来对文本数据进行标记和特征提取。…
最大熵模型
在已知约束的情况下,我们建模时应该满足这些约束,并且对其他条件作最复杂最一般的假设。这样会得出更贴近于真实的结果。一般来说,这种假设就是最大熵原理。因为熵最大信息量最大,不确定性最大。 最大熵原理认为,学习概率模型时,在所有可能的概率分布模型中,熵最大的模型,为最好的模型。 将…
Python 深度学习库 Keras 发布官方中文文档,这里有你需要了解的一切
Keras 框架发明者François Chollet推荐文章的翻译,出于Keras与scikit-learn的相似性,给出的引导教程:通过与scikit-learn的比较来使用Keras。 使用 Keras 创建、评价深度神经网络非常的便捷,不过你需要严格地遵循几个步骤来构建…
奔走相告!亚马逊内部机器学习课程现向大众免费开放
选自aws.amazon,机器之心编译,参与:思源、王淑婷。 该课程已经实施了 20 多年。公司内部上千的工程师都专于机器学习,因此亚马逊的零售页面、产品、实现技术和商店少有不提升的。很多 AWS 客户都从中受益,现在,亚马逊打算向所有开发者开放这些课程,而不是只提供给那些最强…
基于隐变量的推荐模型
矩阵分解上一篇介绍了协同过滤,其重点就是在人-物品矩阵上,其中心思想是去对人或者物品进行聚类,从而找到相似人或者相似物品,用群体的智慧为个人进行推荐,但是,这种近邻模型也存在好多问题:随着人和物品的增
中文分词原理及常用Python中文分词库介绍
中文分词,即 Chinese Word Segmentation,即将一个汉字序列进行切分,得到一个个单独的词。表面上看,分词其实就是那么回事,但分词效果好不好对信息检索、实验结果还是有很大影响的,同时分词的背后其实是涉及各种各样的算法的。 中文分词与英文分词有很大的不同,对英…
ML中相似性度量和距离的计算
在机器学习中,经常需要使用距离和相似性计算的公式,在做分类时,常常需要计算不同样本之间的相似性度量(Similarity Measurement),计算这个度量,我们通常采用的方法是计算样本之间的“距离(Distance)”。比如利用k-means进行聚类时,判断个体所属的类别…