首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
数据分析专栏
蜡笔小xi
创建于2021-09-18
订阅专栏
定期总结数据分析技术与方法,第一时间发布在“DS数说”公众号上,欢迎关注。
等 2 人订阅
共15篇文章
创建于2021-09-18
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
时间序列分析—8大挑战
预测这些数据集的关键是观察时序之间的时间依赖性,以及过去发生的事情是如何影响未来的。但以下8个原因可能是影响时序预测可靠性(预测性能)的主要原因
手写--朴素贝叶斯
手写naivebayes(贝叶斯分类器): 欢迎关注我的公众号,DS数说,原创技术文章第一时间推送哦。 原链接传送门:https://mp.weixin.qq.com/s/Mi-G8FXI7NuYAJ
NewSQL、Lakehouse、HTAP及数据的未来
数据库是像编程语言和操作系统一样的基本技术。而业务需求进一步推动了技术发展。在过去的30年里,从SQL到NoSQL、NewSQL,已经出现了数百种不同的数据库。它们有两个主要的工作负载:OLTP(在线
几种常见采样方法及原理
不平衡数据集是指类别分布严重偏斜的数据集,例如少数类与多数类的样本比例为 1:100 或 1:1000。 训练集中的这种偏差会影响许多机器学习算法,甚至导致完全忽略少数类,容易导致模型过拟合,泛化能力
基于Streamlit_prophet玩转Prophet时序预测
既然是玩转,就得easy,在通俗搞懂核心原理的基础上,重在实践。 本文首先介绍Prophet模型基本使用,再介绍一个开箱即用的开源项目--Streamlit_prophet
MindsDB—写SQL就能建模的数据库
去年就偶遇MindsDB,当时docker部署体验,bug太多,直接放弃。近期闲逛github趋势,MindsDB再次出现(上了周榜)。想必是Bug修复了,能稳定运行,决定再深度使用它,看看能不能在生
机器学习 — Decision Tree
1个月未更新了,年底事情比较多(社畜都懂得~)。上月底报名了百度飞桨的一个常规赛-- MarTech Challenge 点击反欺诈预测 ,搞了一周(社畜只能下班熬夜搞!),运气比较好,水到了Top1
2021科大讯飞-车辆贷款违约预测挑战赛Top1--方案学习
2021科大讯飞-车辆贷款违约预测挑战赛Top1--方案学习 简介 车贷违约预测问题,目的是建立风险识别模型来预测可能违约的借款人。预测结果为借款人是否可能违约,属于二分类问题。 偏数据挖掘的比赛,关
Linux基础(三)
[TOC] 在目录下创建py文件,并进行运行 os模块 在Python中有一个内置库os,是一个系统接口库,operating system interfaces。在linux系统中处理数据、运行脚本
Linux基础(二)
使用vi或vim编辑文件 在linux里的文本编辑,需要掌握一些快捷键操作。一般使用vim 、nano nano nano相对vim来说,更容易上手一些,没有vim那些神奇的操作(用的6的人,感觉ta
时间序列分析—从ARMA到ARIMA再到SARIMA
[TOC] ARMA AR(p),MA(q)二者相结合,即为ARMA(p,q),自回归移动平均。 公式如下: 公式表示: 兼具捕捉滞后项及残差的影响,更具普遍性。确定p,q的阶,根据最小二乘或极大似然
时间序列分析—移动平均(MA)及阶数的判定
一、移动平均模型(MA) 当前值是由过去误差的线性组合组成的,误差是服从正态分布并且相互独立的。 q阶公式: 1.2 对MA的理解 自回归与移动平均建模的差异: 移
linux基础(一)
平时工作也会写些命令行,但都要用的时候才记得,不成体系(忘了就百度),很多命令也老忘记。 这次跟着coggle的开源学习路径梳理一下,巩固基础
5个Pandas组合函数的异同
5个Pandas组合函数的异同。 在日常处理数据的时候,经常会遇到不同dataframe的连接、组合等操作,刚开始用的时候,会有点蒙,毕竟下面几个函数的作用类似,容易产生混淆。
机器学习 - Ensemble Model
某些模型可以很好地模拟这些数据的一个方面,而其他模型则可以很好地模拟另一个方面。集成算法提供了一个解决方案,我们可以训练这些模型,并作出合成预测,其中最终的准确度比每个单独的模型好(三个臭皮匠顶个诸葛