# Summary
参数估计
├── [[点估计]]
│ └── 最大似然估计 (MLE)
└── [[区间估计]]
# Notes
## 1 | 什么是 “参数”?
| 类比 | 统计学术语 | 解释 |
| ---------- | ------------- | ------------------ |
| **地球的半径** | 母体均值 $\mu$ | 描述地球大小的“真实”但未知常数 |
| **投篮球命中率** | 母体比例 $p$ | 真正的命中概率,藏在每次投篮背后 |
| **股票收益波动** | 方差 $\sigma^2$ | 收益起伏的“尺度”,也是一个固定常数 |
> **参数 = “总体”分布里那些固定但我们看不见的刻度**。
> 统计学要做的,就是用有限样本去“猜”这些刻度。
---
## 2 | 为什么要估计参数?
1. **决策**:知道命中率 $p$,教练才能制定投篮策略。
2. **比较**:估出两家工厂的平均缺陷率,才能评价谁更好。
3. **预测**:掌握方差 $\sigma^2$,才能给投资组合设置风险阈值。
---
## 3 | 参数估计的两大基本形式
| 形式 | 问题 | 结果 | 示意 |
| -------- | ------------ | ------------ | --------------------------------- |
| **点估计** | “这个参数大概是多少?” | 给出一个数字 | $\hat{\mu}=23.4$ °C |
| **区间估计** | “它有多大可能落在哪?” | 给出一个范围 + 置信度 | 95% CI: $22.8\!~\text{至}~24.0$ °C |
---
## 4 | 常见点估计方法
| 方法 | 思想一句话 | 经典场景 |
| -------------- | --------------- | --------------- |
| **样本均值** | 把所有观测“求平均” | 估总体均值 $\mu$ |
| **样本比例** | 成功次数 / 总次数 | 估命中率 $p$ |
| **最大似然 (MLE)** | 选“最可能产生这些样本”的参数 | 正态分布均值、方差同时未知 |
| **矩估计** | 让样本矩 = 理论矩 | 估 Gamma 分布形状、尺度 |
> 点估计像“拍一张快照”,给你**最佳猜测**;但不知道准不准。
---
## 5 | 从点到区间:用 **中心极限定理** 给误差上刻度
1. 有点估计 $\hat{\theta}$ 后,计算 **标准误差** $SE$。
* 例如 $\hat{\mu} = \bar{X}$ 时,$SE = s/\sqrt{n}$。
2. 设置信度 95%,取 $z_{0.975}\approx1.96$。
3. 画区间:
$
\hat{\theta}\;\pm\;1.96\times SE
$
> 直观上:**样本多 ($n\uparrow$) → 误差条变窄 → 估计更“靠谱”。**
---
## 6 | 怎样评价“好”估计?
| 指标 | 含义 | 口语解释 |
| ------- | ----------------------------- | ----------------- |
| **无偏性** | $E[\hat{\theta}]= \theta$ | 平均起来不跑偏 |
| **一致性** | $\hat{\theta}\to\theta$ ($n\to\infty$) | 样本越多越逼真 |
| **效率** | 方差最小 | **误差条最短** 中的“省料王” |
| **充分性** | 不丢信息 | 提取了样本里关于参数的全部信号 |
---
## 7 | 极简示例:估计硬币正面概率 $p$
1. 抛 100 次,正面 57 次。
2. **点估计**:$\hat{p}=57/100=0.57$。
3. **标准误差**:$\sqrt{\hat{p}(1-\hat{p})/n}\approx0.049$。
4. **95% 区间**:$0.57\pm1.96×0.049\approx[0.475,0.665]$。
> 意味着:若重复实验无数次,约 95% 的区间会覆盖真 $p$。
---
### 一句话概括
> **参数**是总体分布里“看不见的常数”,**参数估计**用样本先给出一个“最好猜”(点估计),再用误差刻度包出一个“安全范围”(区间估计),让我们既能量化未知,也能衡量不确定性。