| 模型 | 版本/发布日期 | 平均输出速度 | 首字节延迟 | 相对 GPT-4 Turbo | |------|--------------|-------------|-----------|-----------------| | **GPT-4o mini** | Jul 2024 | **≈ 108 t/s** | 0.42 s | **≈ 2.3 ×** | | GPT-4o | Nov 2024 | 188.4 t/s | 0.45 s | 3.9 × | | GPT-3.5 Turbo | Jan 2024 | 77.5 t/s | 0.40 s | 1.6 × | | GPT-4 Turbo | Nov 2023 | 48.0 t/s | 0.73 s |—*(基准)* | | GPT-4 | Mar 2023 | 27.7 t/s | 0.79 s | 0.58 × |