很强也很贵！OpenAI12天12场直播收官，官宣最新推理模型o3

2024-12-21 12:10 澎湃新闻

FrontierMath测试结果

不过，o3和o3-mini并未正式发布，安全研究人员目前可以注册获取o3-mini的预览版，o3预览版也将在之后的某个时间推出，OpenAI没有给出具体时间。在直播的一开始，奥特曼也强调了此次并不是发布，只是宣布o3。他表示，计划在1月底发布o3-mini，然后再发布o3。

据外媒报道，AI安全测试人员发现，与传统的“非推理”模型相比，OpenAI此前发布的o1的推理能力使其试图欺骗人类用户的比例更高，同样，Meta、Anthropic和谷歌的领先模型也是如此。而o3试图欺骗用户的比例可能比它的前身更高。

OpenAI在博客中表示，正在使用一种新技术“慎重对齐”（deliberative alignment），来使o3等模型符合其安全原则。

通过OpenAI所谓的“私人思维链”，o3被训练成在做出反应之前先“思考”。可以对任务进行推理并提前规划，在较长时间内执行一系列动作，帮助找出解决方案。

在实践中，当收到一个提示时，o3会在做出反应之前暂停，考虑一些相关的提示，并沿途“解释”其推理过程。一段时间后，模型会总结出它认为最准确的答案。o3 的新功能是“调整”推理时间，可以设置为低、中或高计算量（即思考时间），计算时间越长，执行任务时的表现就越好。

与GPT-4o等大模型相比，o1模型在拒绝回答恶意越狱提示和不过度拒绝良性越狱提示方面都较为领先。