原文整理页

OpenAI CPO Kevin Weil 宣布 GPT-5.4 在 FrontierMath 数学基准测试中创下新纪录,Pro 版本在最高难度级别得分达 38%

来源作者:Kevin Weil 🇺🇸 (@kevinweil)原始来源:https://x.com/kevinweil/status/2029636466188718448

中文导读

OpenAI CPO Kevin Weil 宣布 GPT-5.4 在 FrontierMath 数学基准测试中创下新纪录,Pro 版本在最高难度级别得分达 38%。

正文 Markdown

GPT-5.4 set a new record on FrontierMath, our benchmark of extremely challenging math problems! We had pre-release access to evaluate the model. On Tiers 1–3, GPT-5.4 Pro scored 50%. On Tier 4 it scored 38%. See thread for commentary and additional experiments.