分布（数理统计）

数理统计中，分布是描述随机变量行为的基础。为了方便查阅和对比，我将常用的分布分为 离散型、连续型 和 三大抽样分布 进行了整理，重点归纳了它们的概率函数、期望、方差及核心性质。

一、常用离散型分布 (Discrete Distributions)

主要描述计数数据（如人数、成功次数）。

分布名称	记号	概率质量函数 (PMF) $P (X = k)$	期望 $E (X)$	方差 $V a r (X)$	典型应用场景 & 性质
0-1分布 (伯努利)	$B (1, p)$	$p^{k} (1 - p)^{1 - k}, k = 0, 1$	$p$	$p (1 - p)$	单次试验成功的概率。二项分布的基础。
二项分布	$B (n, p)$	$C_{n}^{k} p^{k} (1 - p)^{n - k}$	$n p$	$n p (1 - p)$	$n$ 次独立重复试验中成功的次数。当 $n$ 很大、 $p$ 很小时逼近泊松分布。
泊松分布	$P (λ)$	$\frac{λ ^{k}}{k !} e^{- λ}$	$λ$	$λ$	单位时间/空间内稀有事件发生的次数。性质：期望等于方差。
几何分布	$G (p)$	$p (1 - p)^{k - 1}, k = 1, 2...$	$\frac{1}{p}$	$\frac{1 - p}{p ^{2}}$	首次成功所需的试验次数。具有无记忆性。
超几何分布	$H (N, M, n)$	$\frac{C _{M}^{k} C _{N - M}^{n - k}}{C _{N}^{n}}$	$n \frac{M}{N}$	(略复杂)*	不放回抽样。当 $N$ 很大时，可用二项分布近似。

注：几何分布此处定义为“第 $k$ 次是第一次成功”。 *超几何分布方差： $n \frac{M}{N} (1 - \frac{M}{N}) \frac{N - n}{N - 1}$

二、常用连续型分布 (Continuous Distributions)

主要描述测量数据（如时间、长度、温度）。

分布名称	记号	概率密度函数 (PDF) $f (x)$	期望 $E (X)$	方差 $V a r (X)$	典型应用场景 & 性质
均匀分布	$U (a, b)$	$\frac{1}{b - a}, a < x < b$	$\frac{a + b}{2}$	$\frac{( b - a ) ^{2}}{12}$	随机变量在区间内等可能出现。
指数分布	$E x p (λ)$	$λ e^{- λ x}, x > 0$	$\frac{1}{λ}$	$\frac{1}{λ ^{2}}$	独立随机事件发生的时间间隔（如排队等待时间）。唯一具有无记忆性的连续分布。
正态分布	$N (μ, σ^{2})$	$\frac{1}{2 π σ} e^{- \frac{( x - μ ) ^{2}}{2 σ ^{2}}}$	$μ$	$σ^{2}$	自然界最常见的分布。钟形曲线，对称性。 $3 σ$ 准则。

N元正态分布 $f (x_{1}, x_{2}, \dots, x_{n}) = \frac{1}{( 2 π ) ^{n /2} ∣Σ ∣ ^{1/2}} exp {- \frac{1}{2} (x - μ)^{'} Σ^{- 1} (x - μ)}$

💡 重点：正态分布的线性性质

若 $X \sim N (μ_{1}, σ_{1}^{2}), Y \sim N (μ_{2}, σ_{2}^{2})$ 且相互独立，则： $a X + bY \sim N (a μ_{1} + b μ_{2}, a^{2} σ_{1}^{2} + b^{2} σ_{2}^{2})$ 这是数理统计中很多推导的基础。
$X_{i} \sim N (μ_{0}, σ^{2})$ , 样本均值 $\overset{ˉ}{X} \sim N (μ_{0}, \frac{σ ^{2}}{n})$
对于二元正态分布，条件分布 $X_{2} ∣ X_{1} = x_{1}$ 依然是正态分布 $N (μ_{2∣1}, σ_{2∣1}^{2})$ 。公式：

μ_{2∣1} = μ_{2} + ρ \frac{σ _{2}}{σ _{1}} (x_{1} - μ_{1}) = μ_{2} + \frac{σ _{21}}{σ _{11}} (x_{1} - μ_{1})

σ_{2∣1}^{2} = σ_{2}^{2} (1 - ρ^{2}) = σ_{22} - \frac{σ _{21}^{2}}{σ _{11}}

三、三大抽样分布 (Sampling Distributions)

这三个分布是统计推断（假设检验、区间估计）的核心工具，它们都源于正态分布。

1. $χ^{2}$ 分布 (卡方分布)

定义：设 $X_{1}, ..., X_{n}$ 独立且服从标准正态分布 $N (0, 1)$ ，则统计量 $χ^{2} = \sum_{i = 1}^{n} X_{i}^{2}$ 服从自由度为 $n$ 的卡方分布，记为 $χ^{2} (n)$ 。
性质：
- 可加性：若 $X \sim χ^{2} (n_{1}), Y \sim χ^{2} (n_{2})$ 且独立，则 $X + Y \sim χ^{2} (n_{1} + n_{2})$ 。
- 期望 $E (χ^{2}) = n$ ，方差 $V a r (χ^{2}) = 2 n$ 。
用途：用于检验方差、拟合优度检验、列联表分析。

2. $t$ 分布 (学生氏 t 分布)

定义：设 $X \sim N (0, 1), Y \sim χ^{2} (n)$ 且独立，则 $T = \frac{X}{Y / n}$ 服从自由度为 $n$ 的 $t$ 分布，记为 $t (n)$ 。
性质：
- 图形类似标准正态分布，但尾部更厚 (Fat tails)，峰部更低。
- 当 $n \to \infty$ 时， $t (n) \to N (0, 1)$ 。
用途：小样本情况下，未知总体方差时的均值检验。

3. $F$ 分布

定义：设 $U \sim χ^{2} (n_{1}), V \sim χ^{2} (n_{2})$ 且独立，则 $F = \frac{U / n _{1}}{V / n _{2}}$ 服从自由度为 $(n_{1}, n_{2})$ 的 $F$ 分布，记为 $F (n_{1}, n_{2})$ 。
性质：
- $F_{1 - α} (n_{1}, n_{2}) = \frac{1}{F _{α} ( n _{2} , n _{1} )}$ （倒数性质，查表常用）。
用途：方差分析 (ANOVA)、方差齐性检验。

四、分布之间的关键联系 (Cheat Sheet)

理解这些联系能帮你更好地记忆：

二项分布 $\to$ 正态分布：根据中心极限定理，当 $n$ 很大时， $B (n, p)$ 近似于 $N (n p, n p (1 - p))$ 。
二项分布 $\to$ 泊松分布：当 $n$ 很大， $p$ 很小，且 $λ = n p$ 适中时，二项分布近似于泊松分布。
泊松分布与指数分布：如果单位时间内事件发生的次数服从泊松分布 $P (λ)$ ，那么两次事件发生的时间间隔服从指数分布 $E x p (λ)$ 。
三大分布的关系图： $N (0, 1) 平方和 χ^{2} ∣ \frac{N ( 0 , 1 )}{χ ^{2} / n} \to t ∣ \frac{χ ^{2} / n _{1}}{χ ^{2} / n _{2}} \to F$

zhufn

探索

分布（数理统计）

目录

一、常用离散型分布 (Discrete Distributions)

二、常用连续型分布 (Continuous Distributions)

💡 重点：正态分布的线性性质

三、三大抽样分布 (Sampling Distributions)

1. $χ^{2}$ 分布 (卡方分布)

2. $t$ 分布 (学生氏 t 分布)

3. $F$ 分布

四、分布之间的关键联系 (Cheat Sheet)

目录

zhufn

探索

分布（数理统计）

目录

一、 常用离散型分布 (Discrete Distributions)

二、 常用连续型分布 (Continuous Distributions)

💡 重点：正态分布的线性性质

三、 三大抽样分布 (Sampling Distributions)

1. χ2 分布 (卡方分布)

2. t 分布 (学生氏 t 分布)

3. F 分布

四、 分布之间的关键联系 (Cheat Sheet)

目录

一、常用离散型分布 (Discrete Distributions)

二、常用连续型分布 (Continuous Distributions)

三、三大抽样分布 (Sampling Distributions)

1. $χ^{2}$ 分布 (卡方分布)

2. $t$ 分布 (学生氏 t 分布)

3. $F$ 分布

四、分布之间的关键联系 (Cheat Sheet)