数理统计中,分布是描述随机变量行为的基础。为了方便查阅和对比,我将常用的分布分为 离散型、连续型 和 三大抽样分布 进行了整理,重点归纳了它们的概率函数、期望、方差及核心性质。
一、 常用离散型分布 (Discrete Distributions)
主要描述计数数据(如人数、成功次数)。
| 分布名称 | 记号 | 概率质量函数 (PMF) | 期望 | 方差 | 典型应用场景 & 性质 |
|---|---|---|---|---|---|
| 0-1分布 (伯努利) | 单次试验成功的概率。二项分布的基础。 | ||||
| 二项分布 | 次独立重复试验中成功的次数。当 很大、 很小时逼近泊松分布。 | ||||
| 泊松分布 | 单位时间/空间内稀有事件发生的次数。性质:期望等于方差。 | ||||
| 几何分布 | 首次成功所需的试验次数。具有无记忆性。 | ||||
| 超几何分布 | (略复杂)* | 不放回抽样。当 很大时,可用二项分布近似。 |
注:几何分布此处定义为“第 次是第一次成功”。 *超几何分布方差:
二、 常用连续型分布 (Continuous Distributions)
主要描述测量数据(如时间、长度、温度)。
| 分布名称 | 记号 | 概率密度函数 (PDF) | 期望 | 方差 | 典型应用场景 & 性质 |
|---|---|---|---|---|---|
| 均匀分布 | 随机变量在区间内等可能出现。 | ||||
| 指数分布 | 独立随机事件发生的时间间隔(如排队等待时间)。唯一具有无记忆性的连续分布。 | ||||
| 正态分布 | 自然界最常见的分布。钟形曲线,对称性。 准则。 |
N元正态分布
💡 重点:正态分布的线性性质
-
若 且相互独立,则: 这是数理统计中很多推导的基础。
-
, 样本均值
-
对于二元正态分布,条件分布 依然是正态分布 。 公式:
三、 三大抽样分布 (Sampling Distributions)
这三个分布是统计推断(假设检验、区间估计)的核心工具,它们都源于正态分布。
1. 分布 (卡方分布)
- 定义:设 独立且服从标准正态分布 ,则统计量 服从自由度为 的卡方分布,记为 。
- 性质:
- 可加性:若 且独立,则 。
- 期望 ,方差 。
- 用途:用于检验方差、拟合优度检验、列联表分析。
2. 分布 (学生氏 t 分布)
- 定义:设 且独立,则 服从自由度为 的 分布,记为 。
- 性质:
- 图形类似标准正态分布,但尾部更厚 (Fat tails),峰部更低。
- 当 时,。
- 用途:小样本情况下,未知总体方差时的均值检验。
3. 分布
- 定义:设 且独立,则 服从自由度为 的 分布,记为 。
- 性质:
- (倒数性质,查表常用)。
- 用途:方差分析 (ANOVA)、方差齐性检验。
四、 分布之间的关键联系 (Cheat Sheet)
理解这些联系能帮你更好地记忆:
- 二项分布 正态分布:根据中心极限定理,当 很大时, 近似于 。
- 二项分布 泊松分布:当 很大, 很小,且 适中时,二项分布近似于泊松分布。
- 泊松分布与指数分布:如果单位时间内事件发生的次数服从泊松分布 ,那么两次事件发生的时间间隔服从指数分布 。
- 三大分布的关系图: