# Summary 参数估计 ├── [[点估计]] │ └── 最大似然估计 (MLE) └── [[区间估计]] # Notes ## 1 | 什么是 “参数”? | 类比 | 统计学术语 | 解释 | | ---------- | ------------- | ------------------ | | **地球的半径** | 母体均值 $\mu$ | 描述地球大小的“真实”但未知常数 | | **投篮球命中率** | 母体比例 $p$ | 真正的命中概率,藏在每次投篮背后 | | **股票收益波动** | 方差 $\sigma^2$ | 收益起伏的“尺度”,也是一个固定常数 | > **参数 = “总体”分布里那些固定但我们看不见的刻度**。 > 统计学要做的,就是用有限样本去“猜”这些刻度。 --- ## 2 | 为什么要估计参数? 1. **决策**:知道命中率 $p$,教练才能制定投篮策略。 2. **比较**:估出两家工厂的平均缺陷率,才能评价谁更好。 3. **预测**:掌握方差 $\sigma^2$,才能给投资组合设置风险阈值。 --- ## 3 | 参数估计的两大基本形式 | 形式 | 问题 | 结果 | 示意 | | -------- | ------------ | ------------ | --------------------------------- | | **点估计** | “这个参数大概是多少?” | 给出一个数字 | $\hat{\mu}=23.4$ °C | | **区间估计** | “它有多大可能落在哪?” | 给出一个范围 + 置信度 | 95% CI: $22.8\!~\text{至}~24.0$ °C | --- ## 4 | 常见点估计方法 | 方法 | 思想一句话 | 经典场景 | | -------------- | --------------- | --------------- | | **样本均值** | 把所有观测“求平均” | 估总体均值 $\mu$ | | **样本比例** | 成功次数 / 总次数 | 估命中率 $p$ | | **最大似然 (MLE)** | 选“最可能产生这些样本”的参数 | 正态分布均值、方差同时未知 | | **矩估计** | 让样本矩 = 理论矩 | 估 Gamma 分布形状、尺度 | > 点估计像“拍一张快照”,给你**最佳猜测**;但不知道准不准。 --- ## 5 | 从点到区间:用 **中心极限定理** 给误差上刻度 1. 有点估计 $\hat{\theta}$ 后,计算 **标准误差** $SE$。 * 例如 $\hat{\mu} = \bar{X}$ 时,$SE = s/\sqrt{n}$。 2. 设置信度 95%,取 $z_{0.975}\approx1.96$。 3. 画区间: $ \hat{\theta}\;\pm\;1.96\times SE $ > 直观上:**样本多 ($n\uparrow$) → 误差条变窄 → 估计更“靠谱”。** --- ## 6 | 怎样评价“好”估计? | 指标 | 含义 | 口语解释 | | ------- | ----------------------------- | ----------------- | | **无偏性** | $E[\hat{\theta}]= \theta$ | 平均起来不跑偏 | | **一致性** | $\hat{\theta}\to\theta$ ($n\to\infty$) | 样本越多越逼真 | | **效率** | 方差最小 | **误差条最短** 中的“省料王” | | **充分性** | 不丢信息 | 提取了样本里关于参数的全部信号 | --- ## 7 | 极简示例:估计硬币正面概率 $p$ 1. 抛 100 次,正面 57 次。 2. **点估计**:$\hat{p}=57/100=0.57$。 3. **标准误差**:$\sqrt{\hat{p}(1-\hat{p})/n}\approx0.049$。 4. **95% 区间**:$0.57\pm1.96×0.049\approx[0.475,0.665]$。 > 意味着:若重复实验无数次,约 95% 的区间会覆盖真 $p$。 --- ### 一句话概括 > **参数**是总体分布里“看不见的常数”,**参数估计**用样本先给出一个“最好猜”(点估计),再用误差刻度包出一个“安全范围”(区间估计),让我们既能量化未知,也能衡量不确定性。