首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
kekoucoule
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
5
文章 5
沸点 0
赞
5
返回
|
搜索文章
最新
热门
电商用户购买意向预测
京东作为中国最大的自营式电商,在保持高速发展的同时,沉淀了数亿的忠实用户,积累了海量的真实数据。如何从历史数据中找出规律,去预测用户未来的购买需求,让最合适的商品遇见最需要的人,是大数据应用在精准营销中的关键问题,也是所有电商平台在做智能化升级时所需要的核心技术。 以京东商城真…
电商用户群体划分
本案例将通过一个电商用户交易数据集,以用户的实际购买行为数据作为基础,进行用户群体的划分,再基于不同分类信息,分解成不同群体针对运营,从而使企业能更有效的获取客户、使客户更加满意、留住客户成为高价值客户、避免客户流失。 数据集详细描述:数据形状为:542k 行x 8列,8个字段…
集成学习
个体学习器称为“基学习器”(base learner),对应的学习算法为“基学习算法”(base learning algorithm)。 异质集成:个体学习器称为“组件学习器”(component learner)或直称为“个体学习器”。 这就引出了集成学习的两个重要概念:准…
常用的特征工程方法
但是,对于特征工程中引用的新特征,需要验证它的确提高了预测的准确度,而不是加入了一个无用的特征,不然只会增加算法运算的复杂度。 时间戳属性通常需要分离成多个维度比如年、月、日、小时、分钟、秒钟。但是在很多的应用中,大量的信息是不需要的。比如在一个监督系统中,尝试利用一个’位置+…
决策树的损失函数
对于来说,左半边表示的训练数据的误差,也就是训练数据的拟合程度,而|T|表示模型复杂度,α来控制两者之间的关系,相当于一个惩罚系数。当α确定以后,剪枝的策略就是使得损失函数最小化。可以看出,决策树生成学习局部的模型,而决策树剪枝学习整体的模型。 则进行剪枝,即将父结点变为新的叶…
条件熵和信息增益的关系
定义:在一个条件下,随机变量的不确定性。 假设随机变量X表示明天的天气情况,随机变量Y表示今天的湿度,Y 有两种状态 1) 潮湿 2) 干燥。
决策树之ID3算法解读
举个例子,比如一个女孩从年龄,长相,收入,职业的层层筛选来判断相亲对象是否值得见上一面。 正如这种形式,便是一个简单的决策树。 集合 3:3 次去打篮球,3 次不去打篮球。 按照纯度指标来说,集合 1> 集合 2> 集合 3。因为集合 1 的分歧最小,集合 3 的分歧最大。 在…
如何理解SVM损失函数
对于线性支持向量机学习来说,其模型为分离超平面支持向量机W及决策函数支持向量机,其学习策略为软间隔最大化,学习算法为凸二次规划。线性支持向量机学习还有另外一种解释,就是最小化以下目标函数。 称为合页损失函数,下标“+” “+”“+”表示取正值。 在学习支持向量机的过程中,因为其…
解读数据离散化
在数据分析的过程中,数据离散化是我们的经常要处理的事情,呢么究竟什么是数据离散化呢,数据离散化到底有什么作用,今天作者我就来为大家看一下什么是数据离散化。 算法需要。例如决策树,NaiveBayes等算法本身不能直接使用连续型变量,连续型数据只有经离散处理后才能进入算法引擎。这…
离散型特征的编码方式
上一期我们讲了对数据分析中的连续型变量进行离散化处理,相信大家们还没有忘了,那么在对数据进行离散化处理后,接下来应该做什么呢,答案是对离散的特征进行one-hot编码或哑变量编码,接下来我们走进这两种编码方式,来瞅瞅到底它们是什么玩意儿。 下面请跟我一起走进这两种编码方式,感受…
下一页
个人成就
文章被点赞
6
文章被阅读
28,735
掘力值
477
关注了
29
关注者
6
收藏集
2
关注标签
30
加入于
2019-06-23