```mermaid flowchart LR A[输入向量] --> B[计算指数] B --> C[求和] C --> D[归一化] D --> E[概率分布] subgraph 示例 F["[2.0, 1.0, 0.1]"] --> G["[7.4, 2.7, 1.1]"] G --> H["sum = 11.2"] H --> I["[0.66, 0.24, 0.10]"] end ``` # 目的 - 输出总和为1(归一化) - 输出范围在[0,1]之间 - 保持相对大小关系 - 放大差异(exp函数的性质) # 为什么叫"soft"max - 传统max只选最大值(硬选择) - softmax给每个选项一个概率(软选择) - 最大值获得最大概率,但其他值也有概率