贝叶斯公式 - 𓀚 转了码的刘公子

# Summary ![image.png|1000](https://imagehosting4picgo.oss-cn-beijing.aliyuncs.com/imagehosting/fix-dir%2Fpicgo%2Fpicgo-clipboard-images%2F2025%2F11%2F15%2F15-06-05-663a0e96e6f2e1228ef07dc9bad78665-202511151506975-f97727.png) 为啥叫先验概率，因为 X 还没发生 ```python def bayes_update(prior, likelihood_h1, likelihood_h0): """ 贝叶斯更新函数 prior: 假设1的先验概率 likelihood_h1: P(证据|假设1) likelihood_h0: P(证据|假设0) 返回: 假设1的后验概率 """ # 任务：实现贝叶斯更新 posterior = (prior * likelihood_h1) / (prior * likelihood_h1 + ((1 - prior) * likelihood_h0)) # 填写公式 return posterior ``` *用新证据更新旧信念。* 1. 先验概率，去到一个路边不正规赌场，小明和小王怀疑筛子有问题，分别认为有问题的概率是 0.1 和 0.3 2. [[似然函数]]，真筛子出 6 的概率是 1/6，假筛子出 6 的概率是 1/2 3. 后验概率，随着他们去摇色子看到不同的结果，他们会不断更新自己的先验概率，比如一直是 6，两个人认为有问题的概率会快速飙升到 100%，一直是平均随机的，两个人认为有问题的概率会快速降到接近 0% 4. 贝叶斯因子，如果这个作弊筛子设计成偏向 6 的，那么 6 在摇的过程中的出现就会是一个正因子，增加两个人认为作弊的概率上涨 ## 详细对应关系 | 文本分类概念 | 骰子场景对应 | 具体含义 | | | | ----------------------------- | --------------------------------- | --------------- | --- | --- | | **分类目标** | | | | | | 作者（莎士比亚/马洛）| 骰子类型（公平/作弊）| 我们要判断的类别 | | | | **观察证据** | | | | | | 词频向量 | 掷骰序列 | 我们观察到的数据 | | | | 单个词出现次数 | 某个点数出现次数 | 特征的具体值 | | | | **概率成分** | | | | | | $P(\text{作者})$ | $P(\text{骰子类型})$ | **先验概率** | | | | = 作者的初始可能性 | = 0.8（公平）或 0.2（作弊）| 没看到证据前的信念 | | | | $P(\text{词频} \mid \text{作者})$ | $P(\text{掷出结果} \mid \text{骰子类型})$ | **似然** | | | | = 该作者使用这些词的概率 | = 该骰子掷出这些点数的概率 | 如果假设为真，看到证据的可能性 | | | | $P(\text{作者} \mid \text{词频})$ | $P(\text{骰子类型} \mid \text{掷出结果})$ | **后验概率** | | | | = 看到词频后的作者概率 | = 看到结果后的骰子类型概率 | 综合证据后的更新信念 | | | # Cues https://colab.research.google.com/drive/1JeLkzQRYywms9BwmQzaGtUdD51Tptle4#scrollTo=FoNWbDxbW31M [贝叶斯主义者](贝叶斯主义者.md) [凯利公式](凯利公式.md) # Notes ## 贝叶斯公式 ```python def bayes_update(prior, likelihood_h1, likelihood_h0): """ 贝叶斯更新函数 prior: 假设1的先验概率 likelihood_h1: P(证据|假设1) likelihood_h0: P(证据|假设0) 返回: 假设1的后验概率 """ # 任务：实现贝叶斯更新 posterior = (prior * likelihood_h1) / (prior * likelihood_h1 + ((1 - prior) * likelihood_h0)) # 填写公式 return posterior ``` ![image.png|1000](https://imagehosting4picgo.oss-cn-beijing.aliyuncs.com/imagehosting/fix-dir%2Fpicgo%2Fpicgo-clipboard-images%2F2024%2F10%2F13%2F23-03-24-07753fae49e715549b8d734918cac47f-202410132303521-fa09a0.png) 贝叶斯公式的核心是区分那两个符号一个是条件概率，另一个是同时发生. 一个是局部视角一个是全局视角 | **概念** | **作用** | |---|---| | **贝叶斯定理** | 用已知数据计算某事件发生的概率 | | **贝叶斯分类** | 用概率推理进行分类（如垃圾邮件检测）| | **朴素贝叶斯** | 假设特征相互独立，简单高效 | | **贝叶斯网络** | 允许特征之间有依赖关系，适用于更复杂的问题 | 贝叶斯分类的核心就是：**根据历史数据计算某个类别的概率，再用这个概率做出分类决策**。如果你想自己动手试试，我可以帮你写个 Python 代码来演示垃圾邮件分类，你感兴趣吗？