首页
首页
BOT
沸点
课程
直播
活动
AI刷题
NEW
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
《数据分析实战 45 讲》 学习笔记
Amaplan
创建于2023-01-16
订阅专栏
111
等 2 人订阅
共27篇文章
创建于2023-01-16
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
《数据分析实战 45 讲》 学习笔记 Day 27
42丨当我们谈深度学习的时候,我们都在谈什么? 在这篇文章中,我们会通过以下几个方面了解深度学习:数据挖掘、机器学习和深度学习的区别是什么?这些概念都代表什么?我们通过深度学习让机器具备人的能力,甚至
《数据分析实战 45 讲》 学习笔记 Day 26
41丨数据挖掘实战(3):如何对比特币走势进行预测? 我们之前介绍了数据挖掘算法中的分类、聚类、回归和关联分析算法,那么对于比特币走势的预测,采用哪种方法比较好呢?可能有些人会认为采用回归分析会好一些
《数据分析实战 45 讲》 学习笔记 Day 25
39丨数据挖掘实战(1):信用卡违约率分析 今天的学习主要围绕下面的三个目标,并通过它们完成信用卡违约率项目的实战,这三个目标分别是:创建各种分类器,包括已经掌握的 SVM、决策树、KNN 分类器,以
《数据分析实战 45 讲》 学习笔记 Day 24
38丨数据可视化实战:如何给毛不易的歌曲做词云展示? 那么在今天的实战项目里,有 3 个目标需要掌握:掌握词云分析工具,并进行可视化呈现;掌握 Python 爬虫,对网页的数据进行爬取;掌握 XPat
《数据分析实战 45 讲》 学习笔记 Day 23
37丨数据采集实战:如何自动化运营微博? 今天我就带你使用 Python 自动化运营微博。关于今天的学习,希望你能达成以下的 3 个学习目标:掌握 Selenium 自动化测试工具,以及元素定位的方法
《数据分析实战 45 讲》 学习笔记 Day 22
34丨AdaBoost(上):如何使用AdaBoost提升分类器性能? 今天我们学习 AdaBoost 算法。在数据挖掘中,分类算法可以说是核心算法,其中 AdaBoost 算法与随机森林算法一样都属
《数据分析实战 45 讲》 学习笔记 Day 21
# 32丨PageRank(上):搞懂Google的PageRank算法 早期的搜索引擎,会遇到下面的两类问题:返回结果质量不高:搜索结果不考虑网页的质量,而是通过时间顺序进行检索;容易被人钻空子:搜
《数据分析实战 45 讲》 学习笔记 Day 20
31丨关联规则挖掘(下):导演如何选择演员? 首先你需要通过 pip install efficient-apriori 安装这个工具包。 然后看下如何使用它,核心的代码就是这一行 itemsets,
《数据分析实战 45 讲》 学习笔记 Day 19
30丨关联规则挖掘(上):如何用Apriori发现用户购物规则? 1搞懂关联规则中的几个重要概念:支持度、置信度、提升度;2Apriori 算法的工作原理;3在实际工作中,我们该如何进行关联规则挖掘。
《数据分析实战 45 讲》 学习笔记 Day 18
28丨EM聚类(上):如何将一份菜等分给两个人? 今天我来带你学习 EM 聚类。EM 的英文是 Expectation Maximization,所以 EM 算法也叫最大期望算法。 我们先看一个简单的
《数据分析实战 45 讲》 学习笔记 Day 17
# 26丨K-Means(上):如何给20支亚洲球队做聚类? **如何确定 K 类的中心点?如何将其他点划分到 K 类中?如何区分 K-Means 与 KNN?** 如果理解了上面这 3 个问题,
《数据分析实战 45 讲》 学习笔记 Day 16
24丨KNN(上):如何根据打斗和接吻次数来划分电影类型? 我们可以把打斗次数看成 X 轴,接吻次数看成 Y 轴,然后在二维的坐标轴上,对这几部电影进行标记,如下图所示。对于未知的电影 A,坐标为 (
《数据分析实战 45 讲》 学习笔记 Day 15
22丨SVM(上):如何用一根棍子将蓝红两色球分开?什么是有监督的学习模型呢?它指的是我们需要事先对数据打上分类标签,这样机器就知道这个数据属于哪个分类。同样无监督学习,就是数据没有被打上分类标签,这
《数据分析实战 45 讲》 学习笔记 Day 14
# 21丨朴素贝叶斯分类(下):如何对文档进行分类? **sklearn 机器学习包** sklearn 的全称叫 Scikit-learn,它给我们提供了 3 个朴素贝叶斯分类算法,分别是高斯朴素贝
《数据分析实战 45 讲》 学习笔记 Day 13
20丨朴素贝叶斯分类(上):如何让机器判断男女? 贝叶斯原理 我们用一个题目来体会下:假设有一种病叫做“贝叶死”,它的发病率是万分之一,即 10000 人中会有 1 个人得病。现有一种测试可以检验一个
《数据分析实战 45 讲》 学习笔记 Day 12
19丨决策树(下):泰坦尼克乘客生存预测 今天我来带你用决策树进行项目的实战。 sklearn 中的决策树模型 首先,我们需要掌握 sklearn 中自带的决策树分类器 DecisionTreeCla
《数据分析实战 45 讲》 学习笔记 Day 11
18丨决策树(中):CART,一棵是回归树,另一棵是分类树 CART 算法,英文全称叫做 Classification And Regression Tree,中文叫做分类回归树。ID3 和 C4.5
《数据分析实战 45 讲》 学习笔记 Day 10
17 丨决策树(上):要不要去打篮球?决策树来告诉你 决策树的工作原理决策树基本上就是把我们以前的经验总结出来。我给你准备了一个打篮球的训练集。如果我们要出门打篮球,一般会根据“天气”、“温度”、“湿
《数据分析实战 45 讲》 学习笔记 Day9
14丨数据可视化:掌握数据领域的万金油技能 数据可视化的视图都有哪些? 我们常用的可视化视图超过 20 种,分别包括:文本表、热力图、地图、符号地图、饼图、水平条、堆叠条、并排条、树状图、圆视图、并排
《数据分析实战 45 讲》 学习笔记 Day8
13 | 数据变换:考试成绩要求正态分布合理么? 上一讲中我给你讲了数据集成,今天我来讲下数据变换。 如果一个人在百分制的考试中得了 95 分,你肯定会认为他学习成绩很好,如果得了 65 分,就会觉得
下一页