首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
机器学习
databook
创建于2024-08-21
订阅专栏
机器学习相关的基础知识和实践案例
等 2 人订阅
共38篇文章
创建于2024-08-21
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
决策树剪枝:平衡模型复杂性与泛化能力
在机器学习的世界里,决策树是一种简单而强大的算法,但它的 “任性生长” 却常常让数据科学家陷入 “过拟合的困境”。 想象一下,一棵决策树如果无限生长,它可能会完美地拟合训练集中的每一个数据点,但当面对
决策树:机器学习中的“智慧树”
在机器学习的广阔森林中,决策树(Decision Tree)是一棵独特而强大的**“智慧树”**。 它是一种监督学习算法,既可以用于分类任务,也能用于回归任务,通过树形结构模拟人类决策过程。 这篇文章
不平衡样本数据的救星:数据再分配策略
在机器学习领域,数据是模型训练的基础,而数据的分布情况往往会对模型的性能产生重要影响。 不平衡样本数据是我们在实际项目中经常会遇到的问题,它可能导致模型对多数类过度拟合,而对少数类的预测能力不足。 本
线性模型与多分类问题:简单高效的力量
在机器学习的世界里,分类问题无处不在,而多分类问题更是其中的常见挑战。 无论是识别手写数字、分类新闻主题,还是预测客户购买的产品类别,多分类问题都扮演着重要角色。 线性模型,以其简洁高效的特点,成为了
线性判别分析(LDA):降维与分类的完美结合
在机器学习领域,线性判别分析(Linear Discriminant Analysis,简称LDA)是一种经典的算法,它在降维和分类任务中都表现出色。 LDA通过寻找特征空间中能够最大化类间方差和最小
直线思维的进化:线性到广义线性
在数据科学领域,线性模型和广义线性模型是两种基础且重要的统计工具, 它们被广泛应用于各种预测和分析任务中,从简单的回归问题到复杂的分类场景。 今天,让我们深入探讨这两种模型,了解它们的原理、区别以及实
比较检验:找出最佳机器学习模型
在机器学习领域,我们常常需要在多个模型之间进行比较,以选择最适合特定任务的模型。 模型比较检验为此提供了科学的依据和方法。 本文将探讨比较检验的概念、方法、区别与适用范围,并结合scikit-lear
模型的泛化性能度量:方法、比较与实现
在机器学习领域,模型的泛化性能度量是评估模型在未知数据上表现的关键环节。 通过合理的性能度量,不仅能了解模型的优劣,还能为模型的优化和选择提供科学依据。 本文将深入探讨泛化性能度量的重要性、各种度量方
掌握机器学习数据集划分
在机器学习的流程中,数据集的合理划分是模型训练与评估的关键前提。 恰当的划分方式不仅能有效利用数据资源,还能确保模型评估结果的可靠性,为模型的泛化能力提供有力保障。 本文将深入介绍3种常见的数据集划分
scikit-learn中的Pipeline:构建高效、可维护的机器学习流程
我们使用scikit-learn进行机器学习的模型训练时,用到的数据和算法参数会根据具体的情况相应调整变化, 但是,整个模型训练的流程其实大同小异,一般都是加载数据,数据预处理,特征选择,模型训练等几
机器学习中的两个重要函数--sigmoid和softmax
机器学习中,常常见到两个函数名称:sigmoid和softmax。前者在神经网络中反复出现,也被称为神经元的激活函数;后者则出现在很多分类算法中,尤其是多分类的场景,用来判断哪种分类结果的概率更大。
机器学习面试中常见问题整理
机器学习(ML)作为目前一个比较火领域,提供了许多有趣且高薪的工作和机会。 无论你是刚刚踏入机器学习领域的新手,还是已经积累了一定经验的从业者,面试都是检验你技能和知识的重要环节。本文将梳理一些常见的
基尼系数的直观解释
我们在使用分类算法训练数据后,评价分类模型的优劣时,经常会遇到一个词,“基尼系数”。那么,什么是基尼系数呢? 本文将尝试用最简单的方式介绍什么是“基尼系数”以及它的计算方法和意义。希望能让大家对基尼系
神经网络中神经元的权重更新
前段时间写过一篇介绍神经网络的入门文章:神经网络极简入门。那篇文章介绍了神经网络中的基本概念和原理,并附加了一个示例演示如何实现一个简单的神经网络。 不过,在那篇文章中并没有详细介绍神经网络在训练时,
神经网络极简入门
神经网络是深度学习的基础,正是深度学习的兴起,让停滞不前的人工智能再一次的取得飞速的发展。 其实神经网络的理论由来已久,灵感来自仿生智能计算,只是以前限于硬件的计算能力,没有突出的表现,直至谷歌的Al
机器学习的数学基础--向量,矩阵
机器学习与传统编程的一个重要区别在于机器学习比传统编程涉及了更多的数学知识。不过,随着机器学习的飞速发展,各种框架应运而生,在数据分析等应用中使用机器学习时,使用现成的库和框架成为常态,似乎越来越不需
机器学习的数学基础--微积分
微积分运算在机器学习领域扮演着至关重要的角色,它不仅是许多基础算法和模型的核心,还深刻影响着模型的优化、性能评估以及新算法的开发。 掌握微积分,不仅让我们多会一种计算方式,也有助于理解各种机器学习算法
机器学习最佳实践整理
前段时间,基于scikit-learn这个库,对机器学习相关的主要方面写了一系列的文章,其中包括数据加载方面,数据预处理方面,比较知名的一些监督算法和无监督算法的介绍,以及模型的评估和持久化相关的内容