仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接
在概率论与数理统计中,正态分布(高斯分布)被誉为\“分布之王\“,是整个概率分布体系的核心。
许多常见分布都可以通过极限定理、参数变换、特殊情形等方式与高斯分布建立联系。
中心极限定理:无论原始分布如何,独立同分布随机变量的均值在样本量趋于无穷大时,其分布都会趋近于正态分布。
二项分布、泊松分布:在大样本或特定参数极限下,均可近似为正态分布。
卡方分布、t分布、F分布:均可由正态分布的函数推导而来。
对数正态分布:正态分布的指数变换。
伽马分布、指数分布、贝塔分布等:在某些参数极限下也可近似为正态分布。
高斯分布视为\“分布宇宙\“的中心,其他分布或多或少都与其有着密切的联系。
理解高斯分布及其与其他分布的关系,有助于把握整个概率分布体系的本质。
描述:伯努利分布是最简单的离散分布,描述了单次随机试验的结果,该试验只有两种可能的结果:“成功”(通常记为1)或“失败”(通常记为0)。
参数:(成功概率,)
概率质量函数(PMF):
期望(Mean):
方差(Variance):
应用:模拟任何只有两种结果的单一事件,如抛硬币、产品是否合格等。
图像:
描述:二项分布描述了在次独立的伯努利试验中,“成功”发生次的概率。
参数:
(试验次数,的整数)
(每次试验的成功概率,)
概率质量函数(PMF):其中是二项式系数。
期望(Mean):
方差(Variance):
关系:
当时,二项分布退化为伯努利分布。
当很大,很小,且保持不变或近似不变时,二项分布可以用泊松分布近似。
当很大时,根据中心极限定理(棣莫弗-拉普拉斯定理),二项分布可以用正态分布近似。
应用:计算一系列独立重复试验中成功次数的概率,如产品合格数、投票结果等。
图像:
描述:几何分布描述了在一系列独立的伯努利试验中,首次成功发生时所进行的试验次数。(注意:几何分布有两种定义:一种是首次成功时的试验次数,另一种是首次成功前失败的次数。这里我们采用前者,与图中指向负二项分布的含义一致,即几何分布是负二项分布成功次数的特例。)
参数:(单次试验成功的概率,)
概率质量函数(PMF)(for):
期望(Mean):
方差(Variance):
关系:
几何分布是负二项分布在成功次数时的特例。
应用:模拟首次成功所需等待的试验次数,如机器首次故障前的运行次数、连续射击首次命中目标等。
图像:
描述:负二项分布描述了在一系列独立的伯努利试验中,达到预设的(或)次成功时,所进行的试验总次数。(注意:负二项分布也有不同定义,一种是达到次成功时的总试验次数,另一种是达到次成功前失败的次数。这里我们采用前者,即总试验次数。)
参数:
(或,目标成功次数,的整数)
(每次试验成功的概率,)
概率质量函数(PMF)(for):
期望(Mean):
方差(Variance):
关系:
当时,负二项分布即为几何分布。
当使得(常数)时,负二项分布可以用泊松分布近似。
应用:模拟达到指定成功次数所需的总试验次数,如生产线上生产出个合格品所需的总产品数。
图像:
描述:超几何分布描述了从一个包含个物件(其中个具有某种特征,“成功品”,个不具有该特征,“次品”)的有限总体中,进行不放回抽样,抽取个物件时,抽到的“成功品”数量的概率。
参数:
(总体大小,图中对应)
(总体中具有成功特征的物件数,图中对应)
(抽取的样本大小,图中对应)
概率质量函数(PMF):其中的取值范围是。
期望(Mean):
方差(Variance):
关系:
当总体大小相对于样本大小非常大时(即抽样可近似视为有放回),超几何分布可以用二项分布近似。
应用:用于不放回抽样的场景,如质检、扑克牌游戏中特定牌张的抽取等。
图像:
描述:泊松分布描述了在固定的时间间隔或空间区域内,一个随机事件发生的次数。这些事件以已知的平均速率发生,并且事件的发生是相互独立的。
参数:(单位时间或空间内事件发生的平均次数,)
概率质量函数(PMF):
期望(Mean):
方差(Variance):
关系:
如前述,是二项分布和负二项分布在特定条件下的极限形式。
当较大时(通常或且对称性较好时),泊松分布可以用正态分布近似。
应用:模拟稀有事件的发生次数,如一小时内到达某服务台的顾客数、一本书中每页的印刷错误数等。
图像:
描述:连续均匀分布描述了一个随机变量在区间内取任何一个值的概率密度是相等的。
参数:
(区间的下界)
(区间的上界,)
概率密度函数(PDF):
期望(Mean):
方差(Variance):
关系:
当贝塔分布的参数时,它退化为在上的标准均匀分布。
若,则服从参数为的指数分布(InverseTransformSampling)。
若服从指数分布Exp(),则服从分布。
应用:模拟在特定范围内等可能发生的事件,如随机数生成器的基础。
图像:
描述:正态分布是最重要和最广泛应用的连续概率分布,其形状为钟形曲线,对称于均值。许多自然现象和社会现象的度量都近似服从正态分布。
参数:
(均值,决定分布的位置)
(方差,是标准差,决定分布的离散程度或宽度)
概率密度函数(PDF):
期望(Mean):
方差(Variance):
关系:
若,则其线性变换。
特别地,标准化变换服从标准正态分布。
是多种分布(如二项分布、泊松分布、伽马分布、卡方分布)在特定参数条件下的极限或近似分布(中心极限定理)。
若,则服从对数正态分布。
应用:广泛应用于统计推断、误差分析、金融建模等,是许多统计方法的基础。
图像:
描述:标准正态分布是均值为0,标准差(和方差)为1的正态分布,通常用表示。
参数:,
概率密度函数(PDF):
期望(Mean):
方差(Variance):
关系:
任何正态分布都可以通过标准化转换为标准正态分布。
若是独立的标准正态随机变量,则服从自由度为的卡方分布。
若是两个独立的标准正态随机变量,则服从标准柯西分布。
应用:用于计算概率(查Z表)、构建置信区间和进行假设检验。
图像:
描述:如果一个随机变量的自然对数服从正态分布,那么服从对数正态分布。该分布只取正值,且通常是右偏的。
参数:(对应其对数所服从的正态分布的参数)
(对数均值)
(对数方差,)
概率密度函数(PDF)(for):
期望(Mean):
方差(Variance):
关系:
若,则。
反之,若,则。
应用:模拟那些值域为正且分布偏斜的变量,如某些资产价格、收入水平、生物体大小等。
图像:
描述:指数分布描述了独立随机事件发生的时间间隔。它具有“无记忆性”,即未来事件发生的时间与过去已经等待的时间无关。
参数:(率参数,),表示单位时间内事件发生的平均次数。(有时也用尺度参数)
概率密度函数(PDF)(for):
期望(Mean):
方差(Variance):
关系:
指数分布是伽马分布在形状参数(或)时的特例。
指数分布是韦伯分布在形状参数时的特例(此时韦伯尺度参数)。
若事件的发生遵循泊松过程(速率为),则两次连续事件之间的时间间隔服从参数为的指数分布。
如均匀分布处所述,可通过变换得到。
应用:模拟无记忆性的等待时间,如放射性粒子衰变的时间间隔、设备无故障运行时间、顾客到达服务台的时间间隔等。
图像:
描述:伽马分布是一个非常灵活的连续概率分布,用于模拟等待时间的总和。它可以看作是等待(形状参数)个独立的、具有相同率参数的指数分布事件发生所需要的总时间。
参数:
(或,形状参数,)
(或,率参数,)或(尺度参数,)图中用,这里我们用。
概率密度函数(PDF)(usingshape,rate;for):其中是伽马函数。
期望(Mean):
方差(Variance):
关系:
当形状参数时,伽马分布简化为指数分布Exp()。
当形状参数且率参数(即尺度参数)时,伽马分布成为自由度为的卡方分布。
当形状参数很大时,伽马分布可以用正态分布近似。
应用:模拟总等待时间、保险索赔金额、降雨量等。
图像:
描述:卡方分布是由个独立的标准正态随机变量的平方和所构成的分布。它在统计假设检验中非常重要,如拟合优度检验、方差分析和独立性检验。
参数:(自由度,的整数)
概率密度函数(PDF)(for):
期望(Mean):
方差(Variance):
关系:
是伽马分布的特例:。
若独立,则。
应用:统计推断,特别是假设检验和置信区间的构建。
图像:
描述:贝塔分布是一个定义在区间上的连续概率分布族,它可以呈现多种形状(U形、钟形、偏斜等),常用于模拟比例、百分比或概率的随机性。
参数:
(形状参数,)
(形状参数,)
概率密度函数(PDF)(for):其中是贝塔函数。
期望(Mean):
方差(Variance):
关系:
当时,贝塔分布成为上的标准均匀分布。
应用:在贝叶斯统计中作为伯努利和二项分布的共轭先验分布,模拟概率或比例的分布,如转化率、市场份额等。
图像:
描述:柯西分布是一种连续概率分布,以其“重尾”特性而闻名,这意味着它比正态分布更容易出现极端值。柯西分布的期望和方差(以及所有高阶矩)都是未定义的。
参数:
(位置参数,分布的中位数和众数)
(尺度参数,,半峰全宽的一半)
概率密度函数(PDF):
期望(Mean):未定义
方差(Variance):未定义
关系:
若是两个独立的标准正态随机变量,则比率服从标准柯西分布()。
柯西分布是t分布自由度为1的特例。
应用:物理学中的共振现象,某些金融模型中的极端事件建模(尽管由于矩未定义,使用时需谨慎)。
图像:
描述:韦伯分布是一种灵活的连续概率分布,常用于可靠性工程中分析寿命数据,如描述部件的失效时间。其形状可以根据形状参数的不同而变化,可以模拟递增、递减或恒定的失效率。
参数:
(或,形状参数,)
(或,尺度参数,)图中用,这里我们用,其中为形状,为尺度。
概率密度函数(PDF)(for):
期望(Mean):
方差(Variance):
关系:
当形状参数时,韦伯分布简化为指数分布,其率参数为(即)。
当形状参数时,韦伯分布称为瑞利分布(Rayleighdistribution)。
应用:可靠性分析、寿命数据建模、风速分布、材料强度等。
图像:
本文概述了图中所示的16种核心概率分布,涵盖了它们的基本定义、数学特性、应用场景以及部分重要的相互关系。掌握这些分布对于理解和应用统计学方法至关重要。希望这份详尽的解释能帮助您更深入地理解这些强大的统计工具。