首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
数据分析
订阅
Sumorio
更多收藏集
微信扫码分享
微信
新浪微博
QQ
7篇文章 · 0订阅
入门Python数据分析最好的实战项目(一)
首先导入要使用的科学计算包numpy,pandas,可视化matplotlib,seaborn,以及机器学习包sklearn。 然后导入数据,并进行初步的观察,这些观察包括了解数据特征的缺失值,异常值,以及大概的描述性统计。 初步观察到一共有11个特征变量,Price 在这里是…
电商用户行为数据分析(Python+SQL)
一. 项目背景 二. 数据集介绍 三. 数据清洗 四. 分析模型构建 五. 总结 一. 项目背景 项目对京东电商运营数据集进行指标分析以了解用户购物行为特征,为运营决策提供支持建议。 本文采用了MySQL和Python两种代码进行指标计算以适应不同的数据分析开发环境。 二. 数…
机器学习笔记——KNN算法
KNN针对的是分类问题 KNN针对分类问题,通过改变决策规则也可用于回归问题。 分类预测规则:一般采用多数表决法或者加权多数表决法 回归预测规则:一般采用平均值法或者加权平均值法 定义 K Neare
朴素贝叶斯模型
一、算法原理 贝叶斯分类是机器学习中应用极为广泛的分类算法之一,其产生自英国数学家贝叶斯对于逆概问题的思考。朴素贝叶斯是贝叶斯模型当中最简单的一种,其算法核心为如下所示的贝叶斯公式。 其中P(A)为事
数据的描述性统计(Python3 实现)
众数是统计学名词,在统计分布上具有明显集中趋势点的数值,代表数据的一般水平(众数可以不存在或多于一个)。简单来说就是指一组数据中出现次数最多的数据值。 中位数是统计学中的专有名词,代表一个样本、种群或概率分布中的一个数值,其可将数值集合划分为相等的上下两部分。 对于有限的数集,…
人人都要懂点统计学:统计学简明教程
统计学被人称为猜测上帝的游戏,随着大数据和机器学习的发展,统计学的应用前景更加广阔,也带火了统计学专业,让相关从业人员获得了超额回报。即便,并不是所有人都要从事数据分析、机器学习等领域,但懂点统计学对于每个人的工作、生活都有莫大的帮助。 对炒股有所了解的朋友,应该听说过量化投资…
用Python预测「周期性时间序列」的正确姿势
公司平台上有不同的api,供内部或外部调用,这些api承担着不同的功能,如查询账号、发版、抢红包等等。日志会记录下每分钟某api被访问了多少次,即一个api每天会有1440条记录(1440分钟),将每天的数据连起来观察,有点类似于股票走势的意思。我想通过前N天的历史数据预测出第…
[译] Python 的时间序列分析:简介
时间序列是日常生活中其中一种最常见的数据类型。金融市场的价格、天气、家庭耗能、甚至体重都是可以定期收集数据的例子。几乎每个数据科学家都会在日常工作中碰到时间序列,而学习如何为时间序列建模是数据科学中重要的技能。用以分析和预测周期数据的加和模型便是一种简单但强大的模型。背后直观的…
[机器学习]序列数据(介绍)
序列数据是指数据点之间具有明确顺序关系,且顺序本身包含重要信息的数据类型。在机器学习中,序列数据是一种非常常见且重要的数据形式,其核心特征是: 核心特征:顺序依赖 顺序至关重要:改变数据点的顺序会改变