首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
youyou202
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
20
文章 20
沸点 0
赞
20
返回
|
搜索文章
最新
热门
文件批量处理(一)
一、文件批量重命名(根据文件内sheet表名或标题名,匹配正则表达式查找报表代码,将文件名重新命名为报表代码-部门代码) 二、文件批量复制(将重命名后的表批量复制到模板文件夹内用于数据处理)
机器学习(九):协同过滤
协同过滤(Collaborative Filtering):简单来说 是利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息。协同过滤分析用户兴趣,在用户群中找到指定用户的相似用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测。 最基本…
机器学习(八):关联规则
关联规则(Association Rules):反映一个事务与其他事务之间的相互依存性和关联性。关联规则是无监督的机器学习方法,用于知识发现而非预测,关联规则的学习器无需事先对训练数据进行打标签,缺点是很难对关联规则学习器进行模型评估,一般都可以通过业务经验观测结果是否合理。 …
机器学习(七):贝叶斯网络
贝叶斯算法是有监督的学习算法,解决的是分类问题,如新闻分类、评论分类、客户是否流失、是否值得投资、信用等级评定等二分类和多分类问题,核心思想是选择具有最高概率的决策。 注:平滑处理是为了预防某些条件概率为0,数据要先进行二值化才能调用模型(如伯努利模型),不能再模型中做二值化操…
机器学习(六):逻辑回归
Logistic回归是概率型非线性回归模型,是研究二值型输出分类的一种多变量分析方法,可以将二分类的观察结果y与一些影响因素建立关系从而对某些因素条件下某个结果发生的概率进行估计并分类。
机器学习(五):线性回归
线性回归是统计学分析数据的方法,目的在于了解两个或多个变量间是否相关,研究其相关方向与强度,并建立数学模型以便观察特定变量来做预测,由给出的自变量估计因变量的条件期望。 梯度下降法是使得代价函数达到最小的经典方法之一。 算法调优:步长α的选择、算法参数的初始值选择、归一化。 λ…
机器学习案例:保险行业数据分析
业务目标:针对保险公司的健康险产品用户,制作用户画像,然后进行精准保险营销。 1、数据来源:美国某保险公司,现有一款新的医疗险准备上市。 2、产品:这是一款针对65岁以上的人群退出的医疗附加险,销售渠道是直邮。 3、商业目的:为该产品做用户画像,找出最具有购买倾向的人群进行保险…
机器学习(四):决策树
决策树是一种基本的分类和回归方法,由结点和有向边组成,包含根节点(root node)、内部节点(internal node)和叶节点(leaf node)。 规则集合性质:互斥且完备(每个实例都被一条路径或一条规则覆盖,且只被一条路径或一条规则覆盖)。 考虑“年龄”特征有青年…
机器学习(三):聚类
聚类是将大规模、纷繁复杂的数据归为不同类别,进而针对每一类别数据发掘分析和理解的视角来深入把握数据价值并指导生产生活。如电子商务中不同客户群的分类、细分市场研究消费者行为寻找潜在市场、多元分析的预处理。聚类是无监督学习方法,属于探索性分析,不同研究者或不同方法得到的结论不同。 …
机器学习(二):KNN算法
KNN法:又称K近邻法(1967年),核心思想是如果一个样本的前k个最相邻的样本大多属于某个类别,则该样本也属于这个类别,属于有监督的学习方法,可做分类、回归。 算法步骤:计算有标签数据集的点与当前点的距离并按距离升序排列,选取前k个距离最小的点及其所属标签的频率,频率最高的标…
下一页
个人成就
文章被点赞
48
文章被阅读
59,857
掘力值
1,165
关注了
4
关注者
26
收藏集
0
关注标签
3
加入于
2020-04-08