首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
数据分析
Mike123
创建于2023-11-27
订阅专栏
数据分析图片
暂无订阅
共16篇文章
创建于2023-11-27
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
Softmax 与交叉熵:数学原理与梯度推导
引言 在深度学习的分类任务中,Softmax函数与交叉熵损失(Cross-Entropy Loss)的组合堪称经典组合。这对黄金搭档不仅具有数学上的优雅性,更能显著提升模型训练效率。本文将通过直观解释
网络爬虫Xpath和Requests入门介绍及爬取图片应用
免责声明 本博客所提供的网络爬虫示例和相关技术仅供学习与研究用途,所有内容旨在帮助读者了解爬虫技术及其应用。我们不提倡或支持未经授权的爬取行为,所有示例代码和教程的使用者需遵守相关法律法规和目标网站的
基于sklearn的岭回归分析、岭迹图介绍
岭回归 (Ridge Regression) 是一种线性回归模型的改进方法,专门用于解决多重共线性问题以及提高模型的泛化能力。在传统的线性回归中,当特征之间存在较强的相关性时,模型的系数会变得不稳定,
K-Means 聚类算法的原理和实战
K-Means 算法的原理可以概括为通过迭代找到数据集中的 K 个簇中心,将数据点分配到距离最近的簇中,最终使得每个簇内的点尽可能紧密地聚集在一起。它是一种无监督学习算法,通常用于对数据进行聚类分析。
了解决策树算法:原理和实际实现
决策树是机器学习中的基本算法,广泛用于分类和回归任务。它们表示基于从数据中学习的规则的模型,通过根据输入特征的值将数据拆分为子集来做出决策。本博客将介绍决策树背后的原理,包括 CART、ID3 和 C
朴素贝叶斯原理及sklearn中代码使用
朴素贝叶斯(Naive Bayes)是一类基于贝叶斯定理的简单而有效的分类算法。它假设特征之间是相互独立的,即在给定目标变量的情况下,每个特征都不依赖于其他特征。尽管这个假设在实际中很难成立,朴素贝叶
K近邻算法的原理与Sklearn实践
K近邻算法(K-Nearest Neighbor,简称K-NN)是一种广泛应用于分类与回归的基础算法。作为一种基于实例的学习方法,K-NN既没有显式的训练过程,也不依赖模型参数来概括数据的特征,而是直
Tableau快速入门
Tableau入门教程 Tableau是一款强大的数据可视化工具,它能够帮助用户快速创建交互式和可共享的图表、仪表板。无论你是数据分析新手还是经验丰富的数据科学家,Tableau都可以帮助你更高效地分
数据分析中的 A/B 测试(A/B Testing)
A/B测试本质上是一种受控实验(Controlled Experiment),它模拟了科学实验中的对照组设置。我们将用户随机分为两组:A组(对照组)使用当前的产品版本,B组(实验组)使用新版本或改进
深入了解 NumPy 的 `numpy.random.choice` 函数
深入了解 NumPy 的 numpy.random.choice 函数 在数据科学、统计学和机器学习等领域中,随机数生成是一个非常重要的任务。而 NumPy 提供了许多强大的工具来生成随机数
sklearn使用主成分回归与偏最小二乘回归
## 1、导包 ```py import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn
关于scipy.optimize.least_squares非线性最小二乘法
### 用scipy.optimize.least_squares解决带有变量边界的非线性最小二乘问题 `scipy.optimize.least_squares` 是一个功能强大的工具,用于解决带
使用Pandas DataFrame.resample来处理时间序列
Pandas DataFrame.resample方法详解 Pandas库中的DataFrame.resample方法是用于对时间序列数据进行频率转换和重采样的便捷方法。该方法要求对象具有类似日期时间
时间序列基础知识
T\_t: 该趋势显示了长时间内时间序列数据的总体方向。它代表系列的长期进展(长期变化) * S\_t: 具有固定和已知周期的季节性成分。当由于季节性因素(每年、每月或每周)在定期间隔之间观察到明
使用pandas.DataFrame.rolling查看时间序列中的异常值
Pandas是Python中最受欢迎的数据分析和处理库之一,提供了许多强大且灵活的数据操作工具。在Pandas中,DataFrame.rolling方法是一个强大的工具,用于执行滚动窗口计算,能够对数
Machine learning 中Missing Values可视化--missingo
快速可视化数据集中缺失值的好工具是专门的库-missuno。我们将在下面演示它。 1安装 2查看缺失值 matrix() 根据图表中白线的数量,我们可以推断数据集中的缺失值情况。观察到白线越多,说明数