| 模型 | 版本/发布日期 | 平均输出速度 | 首字节延迟 | 相对 GPT-4 Turbo |
|------|--------------|-------------|-----------|-----------------|
| **GPT-4o mini** | Jul 2024 | **≈ 108 t/s** | 0.42 s | **≈ 2.3 ×** |
| GPT-4o | Nov 2024 | 188.4 t/s | 0.45 s | 3.9 × |
| GPT-3.5 Turbo | Jan 2024 | 77.5 t/s | 0.40 s | 1.6 × |
| GPT-4 Turbo | Nov 2023 | 48.0 t/s | 0.73 s |—*(基准)* |
| GPT-4 | Mar 2023 | 27.7 t/s | 0.79 s | 0.58 × |