本文章有许多的数学公式无法直接通过文本展示出来,如果需要详细了解,请直接点击链接查看详细内容介绍。
随机变量
-
定义:随机变量是指变量的值无法预先确定仅以一定的可能性(概率)取值的量。它是由于随机而获得的非确定值,是概率中的一个基本概念。随机变量实质上是函数。称其为变量是指可作为因变量,随机变量一般用大写拉丁字母或小写希腊字母(比如 X, Y, Z )来表示。
-
按照随机变量可能取得的值,可以把它们分为两种基本类型:
- 离散型随机变量,即在一定区间内变量取值为有限个,或数值可以一一列举出来。例如某地区某年人口的出生数、死亡数,某药治疗某病病人的有效数、无效数等。
- 连续型随机变量,即在一定区间内变量取值有无限个,或数值无法一一列举出来。例如某地区男性健康成人的身长值、体重值,一批传染性肝炎患者的血清转氨酶测定值等。
-
性质:随机变量在不同的条件下由于偶然因素影响,其可能取各种随机变量不同的值,具有不确定性和随机性,但这些取值落在某个范围的概率是一定的。
古典概率
-
定义:古典概型也叫传统概率、其定义是由法国数学家拉普拉斯 (Laplace) 提出的。如果一个随机试验所包含的单位事件是有限的,且每个单位事件发生的可能性均相等,则这个随机试验叫做拉普拉斯试验,这种条件下的概率模型就叫古典概型。经典问题有掷骰子游戏。
-
特点:有限性,等可能性
-
计算步骤:
- 算出所有基本事件的个数 n 。
- 求出事件 A 包含的所有基本事件数 m 。
- 代入公式 P(A)=m/n ,求出 P(A)。
-
概率公理: 指定给每一个事件空间 S 中的事件 A 一个实数 P(A),并且其满足下面的 3 个公理,那么函数 P 叫做概率函数,相应的 P(A) 叫做事件 A 的概率。
- 公理 1: 0<=P(A)<=1 (A∈S)
- 公理 2: P(S)=1
- 公理 3: P(A∪B)=P(A)+P(B),如果A∩B=Ø
条件概率
-
定义:设 A 与 B 为样本空间 Ω 中的两个事件,其中 P(B)>0。那么在事件 B 发生的条件下,事件 A 发生的条件概率为:P(A|B)=P(A∩B)/P(B),条件概率有时候也称为后验概率。
-
统计独立性:当且仅当两个随机事件 A 与 B 满足 P(A∩B)=P(A)P(B),它们是统计独立的,这样联合概率可以表示为各自概率的简单乘积。同样的,对于两个独立事件 A 与 B 有 P(A|B)=P(A),P(B|A)=P(B)。
-
互斥性:当且仅当 A 与 B 满足 P(A∩B)=0,且 P(A)≠0,P(B)≠0 的时候,A 与 B 是互斥的。因此 P(A|B)=0,P(B|A)=0。
离散变量和连续变量
-
定义:在统计学中,变量按变量值是否连续可分为连续变量与离散变量两种。
-
离散变量是指其数值只能用自然数或整数单位计算的则为离散变量。例如:企业个数,职工人数,设备台数等,只能按计量单位数计数,这种变量的数值一般用计数方法取得。
-
在一定区间内可以任意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值。例如:生产零件的规格尺寸,人体测量的身高,体重,胸围等为连续变量,其数值只能用测量或计量的方法取得。
-
性质:符号 x 如果能够表示对象集合 S 中的任意元素,就是连续变量。如果变量的域(即对象的集合 S )是离散的,该变量就是离散变量;如果它的域是连续的,它就是连续变量。
期望值
-
定义:期望值是随机试验在同样的机会下重复多次的结果计算出的等同“期望”的平均值。需要注意的是,期望值并不一定等同于常识中的“期望”——“期望值”也许与每一个结果都不相等。
-
如果 X 是在概率空间(Ω,F,P)中的随机变量,则期望值 E(X)=∫x*f(x)dx,并不是每一个随机变量都有期望值的,因为有的时候上述积分不存在。
-
如果 X 是离散的随机变量,输出值为 x1,x2,x3,...,和输出值相应的概率为 p1,p2,...(概率和为1)若 Σpixi 绝对收敛,那么期望值 E(X) 是一个无限数列的和,即一个离散性随机变量的期望值是试验中每次可能的结果乘以其结果概率的总和。
-
如果两个随机变量的分布相同,则它们的期望值也相同。
二项分布
- 定义:二项分布(英语:Binomial distribution)是n个独立的是或非试验中成功的次数的离散概率分布,其中每次试验的成功概率为 p。这样的单次成功/失败试验又称为伯努利试验。实际上,当 n = 1时,二项分布就是伯努利分布。二项分布是显著性差异的二项试验的基础。
伯努利分布
-
定义:伯努利分布(又名两点分布或者 0-1 分布,是一个离散型概率分布)若伯努利试验成功,则伯努利随机变量取值为 1。若伯努利试验失败,则伯努利随机变量取值为 0。记其成功概率为 p(0<=p<=1),失败概率为 q=1-p。
-
期望值为 p ,方差为 pq 。
泊松分布
-
定义:泊松分布适合于描述单位时间内随机事件发生的次数的概率分布。若 X 服从参数为 λ 的泊松分布,记为 X~π(λ) ,或记为 X~P(λ)。如电话交换机接到呼叫的次数、汽车站台的候客人数、机器出现的故障数等等。
-
泊松分布的参数 λ 是单位时间(或单位面积)内随机事件的平均发生率。
-
性质:
- 服从泊松分布的随机变量,其数学期望与方差相等,同为参数 λ 。
- 两个独立且服从泊松分布的随机变量,两者的和仍然服从泊松分布。
均匀分布
- 定义:均匀分布或称规则分布。植物种群的个体是等距分布,或个体之间保持一定的均匀的间距。均匀分布在自然情况下极为罕见,而人工栽培的有一定株行距的植物群落即是均匀分布,如水稻、麦田等。
- 离散型均匀分布是一个离散型概率分布,其中有限个数值拥有相同的概率。
- 连续型均匀分布,如果连续型随机变量 X 具有如下的概率密度函数,则称 X 服从 [a,b] 上的均匀分布。
正态分布
- 定义:正态分布的概率密度函数均值为 μ 方差为 σ^2 (或标准差 σ)是高斯函数的一个实例。
指数分布
-
定义:指数分布是一种连续概率分布。指数分布可以用来表示独立随机事件发生的时间间隔,比如旅客进入机场的时间间隔、打进客服中心电话的时间间隔、中文维基百科新条目出现的时间间隔等等。
-
随机变量 X 的期望值是 1/λ , 方差是 1/(λ^2)。
伽玛分布
- 伽玛分布是统计学的一种连续概率函数。伽玛分布中的参数 α,称为形状参数,β 称为尺度参数。
贝塔分布
- 在概率论中,Β分布也称贝塔分布,是指一组定义在 (0,1) 区间的连续概率分布,有两个参数 α,β>0。
威布尔分布
- 威布尔分布(Weibull distribution)是可靠性分析和寿命检验的理论基础。
卡方分布
- 若 k 个随机变量 Z1,Z2,...是相互独立,符合标准正态分布的随机变量(数学期望为0、方差为1),则随机变量Z的平方和被称为服从自由度为 k 的卡方分布。
F-分布
- 在概率论和统计学里,F-分布(F-distribution)是一种连续概率分布,被广泛应用于似然比率检验,特别是 ANOVA 中。