```mermaid
flowchart LR
A[输入向量] --> B[计算指数]
B --> C[求和]
C --> D[归一化]
D --> E[概率分布]
subgraph 示例
F["[2.0, 1.0, 0.1]"] --> G["[7.4, 2.7, 1.1]"]
G --> H["sum = 11.2"]
H --> I["[0.66, 0.24, 0.10]"]
end
```
# 目的
- 输出总和为1(归一化)
- 输出范围在[0,1]之间
- 保持相对大小关系
- 放大差异(exp函数的性质)
# 为什么叫"soft"max
- 传统max只选最大值(硬选择)
- softmax给每个选项一个概率(软选择)
- 最大值获得最大概率,但其他值也有概率