质量
每个在线模型的评测正确性——基准分数与通过率,而非延迟。
| 模型 | 类型 | 分数 | 通过率 | 详情 |
|---|---|---|---|---|
| Claude Haiku 4.5Claude | 语言模型 | 待评测 | — | |
| Claude Opus 4.8Claude | 语言模型 | 待评测 | — | |
| Claude Sonnet 4.6Claude | 语言模型 | 待评测 | — | |
| GPT Image 2GPT Image 2 | 图像生成 | 待评测 | — | |
| GPT-5.3 CodexGPT | 语言模型 | 待评测 | — | |
| GPT-5.4GPT | 语言模型 | 待评测 | — | |
| GPT-5.4 MiniGPT | 语言模型 | 待评测 | — | |
| GPT-5.5GPT | 语言模型 | 待评测 | — |