Python中的库尔托斯

413 阅读5分钟

写一篇文章

注册

登录

寻找开发者和导师社区帖子博客注册登录

[

](www.codementor.io/projects?re…)

Mikhail Sidyakov

关注

拥有3年以上经验的数据科学家

Python中的Kurtosis

发表于 12月26日, 2021

Kurtosis in Python

在本教程中,我们将探讨如何在Python中计算峰度。

目录

  • 简介
  • 什么是峰度?
  • 如何计算峰度?
  • 如何在Python中计算峰度?
  • 总结

简介

峰度主要是描述一个概率分布的形状,特别是它的 "尾部 "的措施。

计算出的统计量评估了一个给定的概率分布的尾部与正常分布相比有多厚或多薄。

偏度的重点是根据极端值来区分分布的尾部(或者简单地说是尾部的对称性),而峰度则是衡量任何一个尾部是否有极端值(或者简单地说是尾部是重还是轻)。

要继续学习本教程,我们将需要以下Python库:scipy。

如果你没有安装它,请打开 "命令提示符"(在Windows上)并使用以下代码安装它。

pip install scipy

什么是峰度?

在统计学中,峰度是衡量一个概率分布的相对峰值,或者说是衡量其尾部有多重或多轻。峰度值描述了一个给定的概率分布的尾部与正常分布的不同程度。

峰度可以有几个值。

图片来源

  • 正的超额峰度--当超额峰度,即(峰度-3),为正值时,则该分布有一个尖锐的峰值,被称为leptokurtic分布。
  • 负的超常峰度--当超常峰度(由(kurtosis-3)给出)为负时,则分布有一个平坦的峰值,被称为柏拉图库尔特分布。
  • 零过剩峰度--当由(峰度-3)给出的过剩峰度为零时,则分布遵循正态分布,也被称为中峰度分布。

下面是以表格形式对上述内容的总结。

如何计算峰度?

峰度的测量是作为分布的第四个标准化矩计算的。

听起来有点复杂?请按照接下来的步骤,对计算方法有一个完整的了解。

分布的第k^{th}k时刻可以计算为。

如前所述,偏度是分布的第四时刻,可计算为:。

并知道分布的第二矩是它的方差,我们可以将上述公式简化为

其中。

例子。

上面有很多公式。为了使这一切变成一个更好理解的概念,让我们看看一个例子!

考虑以下由10个数字组成的序列,代表学生的考试成绩。

xxx= [55, 78, 65, 98, 97, 60, 67, 65, 83, 65] 。

计算X的平均值,我们得到:x¯=73.3\bar{x}=73. 3x¯=73 .3。

求解m4m_4m4。

求解m2m_2m2。

求解KKK。

如何在Python中计算峰度?

在这一节中,我们将通过一个在Python中计算峰度的例子。

首先,让我们创建一个像上一部分那样的数字列表。

x = [55, 78, 65, 98, 97, 60, 67, 65, 83, 65]

为了计算偏度的Fisher-Pearson相关性,我们将需要scipy.stats.kurtosis函数。

from scipy.stats import kurtosis
print(kurtosis(x, fisher=False))

而我们应该得到。

2.0453729382893178

注意:在上面的代码中设置fisher=False可以计算Pearson定义的kurtosis,其中正态分布的kurtosis值=3。

我们发现,对于给定的数字序列,峰度值约为2.05,超额峰度值约为-0.95。这表明我们的分布具有较厚的尾部,比正态分布更平坦。

总结

在这篇文章中,我们讨论了如何使用scipy库在Python中计算一组数字的峰度。

如果你有任何问题或有一些编辑的建议,欢迎在下面留言,并查看我更多的统计文章。

Python统计学数据分析数据科学机器学习

报道

喜欢这篇文章吗?如果对你有帮助,请给Mikhail Sidyakov一个赞。

1

分享

Mikhail Sidyakov

拥有3年以上经验的数据科学家

我是一名数据科学家,主要在零售领域工作。我的专长是营销优化、物流优化和推荐引擎。我拥有经济学、运筹学和分析学的多个高级学位。

关注

发现并阅读Mikhail Sidyakov的更多文章

开始

喜欢这个帖子吗?

请为米哈伊尔留下喜欢和评论

1

成为第一个分享您意见的人

支持GitHub口味的markdown

提交

显示更多回复