很强也很贵！OpenAI12天12场直播收官，官宣最新推理模型o3

2024-12-21 12:10 澎湃新闻

OpenAI的12天12场直播收官，离AGI（artificial general intelligence，通用人工智能）似乎又更近了一步。

当地时间12月20日，和网友猜测的一样，人工智能（AI）巨头OpenAI发布最新推理模型o3和o3-mini。前一天，OpenAI公司CEO山姆·奥特曼（Sam Altman）就曾发文提到三个“o”暗示了o3的到来。

为何新模型跳过了o2直接命名o3？奥特曼表示是为了避免和英国电信运营商O2冲突，“按逻辑应该称为o2，但我们起名字的能力实在太糟了，只能把它称作o3”。

据介绍，在编码测试SWE-Bench Verified中，o3性能比o1高出22.8%；在Codeforces竞技编程中得分为2727分，相当于位列第175名的人类选手，甚至超过了OpenAI的首席科学家（2655分）；在数学竞赛AIME 2024和专家级科学问题基准测试GPQA Diamond中成绩都得到明显提升；而在令很多AI和数学家都束手无策的最难数学和推理挑战FrontierMath中，o3解决了25.2%的问题，其他模型均未超过2%。

o3在多个测试中得分都较上一代产品o1得到明显提升

1 2 3 下一页

很强也很贵！OpenAI12天12场直播收官，官宣最新推理模型o3

今日热点

小编精选

视角