泊松分布是 [二项分布](二项分布.md) 的极限形式
<!-- more -->
用一个 " 栗子 " 讲清楚泊松分布 - 梁唐的文章 - 知乎
https://zhuanlan.zhihu.com/p/139114702
是的,泊松分布可以看作是二项分布在某些条件下的极限情况。具体来说,当二项分布的试验次数 (n) 趋向于无穷大,同时成功的概率 (p) 趋向于零,但 (np)(即期望值)保持恒定时,二项分布将趋近于泊松分布。
更详细的解释:
二项分布描述了在 (n) 次独立试验中,成功次数 (k) 的概率,每次试验成功的概率为 (p)。其概率质量函数为:
P(X = k) = \binom{n}{k} p^k (1-p)^{n-k}
其中,(\binom{n}{k}) 是组合数,表示从 (n) 次试验中选出 (k) 次成功的方法数。
当 (n) 很大且 (p) 很小时,计算二项分布的概率会变得复杂。在这种情况下,我们可以通过以下步骤将二项分布转化为泊松分布:
1. 设定期望值:令 ( \lambda = np ),并保持 ( \lambda ) 为常数。
2. 调整参数:随着 ( n ) 趋向于无穷大, ( p ) 趋向于零,同时保证 ( \lambda ) 不变。
在这种条件下,二项分布的概率质量函数可以近似为泊松分布的概率质量函数:
P(X = k) \approx \frac{\lambda^k e^{-\lambda}}{k!}
这是因为当 (n) 趋向于无穷大且 p 很小时,组合数和幂函数的乘积可以近似为泊松分布的形式。
举例说明:
假设我们有一个事件,平均每分钟发生 5 次(即 \lambda = 5)。如果我们把这 1 分钟分成非常多的子间隔(例如每秒),那么每个子间隔内事件发生的概率就会非常小,但总体的期望值还是 5 次。这种情况下,我们可以用泊松分布来近似描述这个事件在一分钟内发生的次数。
通过上述过程,我们可以理解泊松分布是二项分布在特定条件下的极限情况。这一性质使得泊松分布在描述稀有事件(如电话呼叫、事故发生等)的次数时非常有用。
## Hashmap
哈希碰撞就是稀有时间