首页
首页
沸点
课程
直播
活动
竞赛
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
炸炸呼呼
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
10
文章 10
沸点 0
赞
10
返回
|
搜索文章
最新
热门
【附代码】十大经典排序算法
常见的内部排序算法有:插入排序、希尔排序、选择排序、冒泡排序、归并排序、快速排序、堆排序、基数排序等。n:数据规模。k:“桶”的个数。In-place:占用常数内存,不占用额外内存。Out-place:占用额外内存。1.1.比较相邻的元素。如果第一个比第二个大,就交换他们两个。对...
14种可用于时间序列预测的损失函数
在处理时间序列预测问任务时,损失函数的选择非常重要,因为它会驱动算法的学习过程。以往的工作提出了不同的损失函数,以解决数据存在偏差、需要长期预测、存在多重共线性特征等问题。本文工作总结了常用的的 14 个损失函数并对它们的优缺点进行分析,这些损失函数已被证明在不同领域提供了最先进...
【一文速通】机器学习样本不均衡/数据分布不同怎么办?
样本(类别)样本不平衡(class-imbalance)指的是分类任务中不同类别的训练样例数目差别很大的情况,一般地,样本类别比例(Imbalance Ratio)(多数类vs少数类)明显大于1:1(如4:1)就可以归为样本不均衡的问题。现实中,样本不平衡是一种常见的现象,如:金...
【一文速通】数据分布不同解决办法
1. 当出现训练集和测试集分布不一致的,我们可以试图去构建跟测试集分布近似相同的验证集,保证线下验证跟线上测试分数不会抖动,这样我们就能得到稳定的benchmark。1.TimeSeriesSplit:Sklearn提供的TimeSeriesSplit。固定窗口滑动划分法:固定时...
【一文讲通】如何检测数据满足同分布
1.群体稳定性指标(Population Stability Index,PSI), 衡量未来的样本(如测试集)及训练样本评分的分布比例是否保持一致,以评估数据/模型的稳定性(按照经验值,PSI<0.1分布差异是比较小的。)。同理,PSI也可以细化衡量特征值的分布差异,评估数据特...
【超详细】深度聚类
现有的深度聚类算法大都由聚类损失与网络损失两部分构成,博客从两个视角总结现有的深度聚类算法,即聚类模型与神经网络模型。1. 经典聚类即数据通过各种表示学习技术以矢量化形式表示为特征。随着数据变得越来越复杂和复杂,浅层(传统)聚类方法已经无法处理高维数据类型。为了解决该问题,深度聚...
【可视化】无法理解PCA,条件概率,最小二乘回归?可视化帮你!
首先,只考虑两个维度的数据集,比如高度和重量。这个数据集可以绘制成平面上的点。但如果想要整理出变量,PCA会找到一个新的坐标系,其中每个点都有一个新的(x,y)值。坐标轴实际上没有任何物理意义。它们是高度和重量的组合,被称为“主分量”。PCA对于降维很有用。下面,我们将数据绘制成...
【超详细】LightGBM介绍与应用
1. 2.2.2.2. 2.2. 2.2.6.2.6.2.6.2.3.3. 3.4. 4.4.5. 1. LightGBM (Light Gradient Boosting Machine)由微软提出,主要用于解决 GDBT 在海量数据中遇到的问题,以便其可以更好更快地用于工业实...
任务间通信的基本知识
1. 信号量:信号量其实就是一种通过数字大小来实现限制资源使用的一种机制,设置信号量其实就是设置资源最大可以允许多少个任务同时访问同一个资源,通过信号量pend和post操作即信号量变量的加减实现任务控制。2. 互斥锁:互斥锁就是同一时间只有一个任务可以占有资源,当有其他任务要访...
OS_FLAG.C(3)
上篇我们介绍了创建和删除事件标志组函数,后来在接着看源代码的时候,发现倒着来更有助于理解。所以后面几篇我会选择较为合适的方式来不定期更博,方便大家理解。1.* list of tasks waiting for the event flag.* event flag bit(s)...
下一页
个人成就
文章被点赞
25
文章被阅读
15,158
掘力值
583
关注了
0
关注者
5
收藏集
0
关注标签
6
加入于
2021-03-05