概率分布
基本概念
随机变量
定义
设随机试验的样本空间是S。若对S中的每个样本点e,都有唯一的实数值X(e)与之对应,则称X(e)为随机变量,简记为X。
随机变量的本质是函数(一种映射关系),整个取值范围就是整个样本空间。取值带有不确定性,当然是在样本空间这个范围内。
样本空间:随机试验的所有可能结果构成的集合。
目的是建立试验结果(样本空间中的点,同基本事件e)与实数之间的对应关系(例如将”正面”映射为1,”反面”映射为0)
古典概率
如果一种事件产生的结果固定,且每种结果的概率相同,这种事件就称为古典事件。古典事件的结果概率称为古典概率
古典事件每种结果出现的概率表示为:
条件概率
条件概率是指事件A在另外一个事件B已经发生条件下的发生概率。
条件概率表示为:P(A|B),读作“在B的条件下A的概率”。
概率分布
连续变量 & 离散变量
在统计学中,变量按变量值是否连续可分为连续变量与离散变量两种。
在一定区间内可以任意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值。
离散变量指变量值可以按一定顺序一一列举,通常以整数位取值的变量
离散型概率分布
二项分布
- 做某件事的次数(也叫试验次数)是固定的,用n表示。
- 每一次事件都有两个可能的结果(成功,或者失败)
- 每一次成功的概率都是相等的,成功的概率用p表示
- 你感兴趣的是成功x次的概率是多少。那么就可以用二项分布的公式快速计算出来了。
满足以上条件就可以称为二项分布
伯努利分布
伯努利分布是一个离散型机率分布,是N=1时二项分布的特殊情况
泊松分布
泊松分布考虑的是在连续时间或空间单位上发生的随机事件次的概率
基于过去某个随机事件在某段时间或某个空间内发生的平均次数,预测该随机事件在未来同样长的时间或同样大的空间内发生N次的概率
常被用来解决销量较低的商品库存控制,特别是价格昂贵,需求量不大的商品
连续型概率分布
均匀分布
均匀概率分布是古典概率分布的连续形式,是指随机事件的可能结果是连续型数据变量,所有的连续型数据结果所对应的概率相等
在概率论和统计学中,均匀分布也叫矩形分布,它是对称概率分布,在相同长度间隔的分布概率是等可能的
卡方分布
k 个独立的标准正态分布变量的平方和服从自由度为k 的卡方分布。卡方分布常用于假设检验和置信区间的计算。
beta分布
用一句话来说,beta分布可以看作一个概率的概率分布,当你不知道一个东西的具体概率是多少时,它可以给出了所有概率出现的可能性大小。