首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
大数据
订阅
爕
更多收藏集
微信扫码分享
微信
新浪微博
QQ
29篇文章 · 0订阅
【火炉炼AI】机器学习025-自动估算集群数量-DBSCAN算法
在前面的文章【火炉炼AI】机器学习024-无监督学习模型的性能评估--轮廓系数中,我们自己定义了一个通用型函数,用于为 K-means算法寻找最佳的K值,这个函数虽然有效,但是却不高效,这是一个非常耗时的过程。而DBSCAN算法却是一个快速的,高效的自动评估集群数量的算法。 1…
【火炉炼AI】机器学习024-无监督学习模型的性能评估--轮廓系数
前面我们学习过监督学习模型的性能评估,由于数据集有标记,所以我们可以将模型预测值和真实的标记做比较,计算两者之间的差异,从而来评估监督学习模型的好坏。 但是,对于无监督学习模型,由于没有标记数据,我们该怎么样评估一个模型的好坏了?显然,此时我们不能采用和监督学习模型一样的评估方…
【火炉炼AI】机器学习023-使用层次聚类算法构建模型
聚类的算法有很多种,前面我们讲解了k-means算法和均值漂移算法,此处我们继续讲解层次聚类算法。 k-means是一种分散性聚类算法,以空间中K个点为中心进行聚类,将最靠近他们的样本收归门下。k-means的优势在于简单快速,对于大数据集,该算法仍然可以保持可伸缩性和高效率,…
【火炉炼AI】机器学习008-简单线性分类器解决二分类问题
分类问题,就是将数据点按照不同的类别区分开来,所谓人以类聚,物以群分,就是这个道理。以前的【机器学习001-007】都是讲解的回归问题,两者的不同之处在于:回归输出的结果是实数,并且一般是连续的实数值,而分类问题的输出结果是离散的某一个类别或不同类别的概率。 最简单的分类问题是…
【火炉炼AI】机器学习020-使用K-means算法对数据进行聚类分析
前面的机器学习类文章(编号从010-019)都是关于监督学习,但是从本篇文章开始,炼丹老顽童要开始讲解无监督学习方面,无监督学习是指处理的数据没有任何形式的标记,我们没有对训练数据集进行实现的类别划分,故而相当于抹黑处理,要让机器学习自己找出样本所属的类别,那么机器学习通过什么…
【火炉炼AI】机器学习019-项目案例:使用SVM回归器估算交通流量
我们都知道,SVM是一个很好地分类器,不仅适用于线性分类模型,而且还适用于非线性模型,但是,在另一方面,SVM不仅可以用于解决分类问题,还可以用于解决回归问题。 本项目打算使用SVM回归器来估算交通流量,所使用的方法和过程与我的上一篇文章【火炉炼AI】机器学习018-项目案例:…
【火炉炼AI】机器学习006-用决策树回归器构建房价评估模型
最近几十年,房价一直是中国老百姓心中永远的痛,有人说,中国房价就像女人的无肩带文胸,一半人在疑惑:是什么支撑了它?另一半人在等待:什么时候掉下去? 而女人,永不可能让它掉下来。就算快掉下来了,提一提还是又上去了..... 虽然我们不能预测中国房价什么时候崩盘,但是却可以用机器学…
【火炉炼AI】机器学习004-岭回归器的构建和模型评估
在我的上一篇文章(【火炉炼AI】机器学习003-简单线性回归器的创建,测试,模型保存和加载)中,已经详细的讲解了简单线性回归器的构建和测试,简单线性回归器的优势在“简单”,运行速度快,但缺点也在于“简单”,过于简单以至于难以拟合很多复杂的数据集。 比如,如果数据集中存在一些远离…
【火炉炼AI】机器学习002-标记编码方法
监督学习中的标记的形式有各种各样,比如对于人脸识别的标记,可能是[“小红”,“小花”,“翠花”。。。],这些标记对于机器学习来说,如同天书一般,故而为了让机器学习“看懂”这些标记,需要将这些文本类的标记进行一定的编码,形成比如【3,2,4,0,…】等形式. 1. 编码方法 有很…
【火炉炼AI】机器学习001-数据预处理技术(均值移除,范围缩放,归一化,二值化,独热编码)
数据预处理的必要性:在真实世界中,经常需要处理大量的原始数据,这些原始数据是机器学习算法无法理解的,所以为了让机器学习算法理解原始数据,需要对数据进行预处理。 1. 均值移除(Mean removal) 把每个特征的平均值移除,以保证特征均值为0(即标准化处理),这样做可以消除…