很强也很贵!OpenAI12天12场直播收官,官宣最新推理模型o3

FrontierMath测试结果
不过,o3和o3-mini并未正式发布,安全研究人员目前可以注册获取o3-mini的预览版,o3预览版也将在之后的某个时间推出,OpenAI没有给出具体时间。在直播的一开始,奥特曼也强调了此次并不是发布,只是宣布o3。他表示,计划在1月底发布o3-mini,然后再发布o3。
据外媒报道,AI安全测试人员发现,与传统的“非推理”模型相比,OpenAI此前发布的o1的推理能力使其试图欺骗人类用户的比例更高,同样,Meta、Anthropic和谷歌的领先模型也是如此。而o3试图欺骗用户的比例可能比它的前身更高。
OpenAI在博客中表示,正在使用一种新技术“慎重对齐”(deliberative alignment),来使o3等模型符合其安全原则。
通过OpenAI所谓的“私人思维链”,o3被训练成在做出反应之前先“思考”。可以对任务进行推理并提前规划,在较长时间内执行一系列动作,帮助找出解决方案。
在实践中,当收到一个提示时,o3会在做出反应之前暂停,考虑一些相关的提示,并沿途“解释”其推理过程。一段时间后,模型会总结出它认为最准确的答案。o3 的新功能是“调整”推理时间,可以设置为低、中或高计算量(即思考时间),计算时间越长,执行任务时的表现就越好。
与GPT-4o等大模型相比,o1模型在拒绝回答恶意越狱提示和不过度拒绝良性越狱提示方面都较为领先。
今日热点
小编精选
-
来源:杭州网
-
恩捷股份拿下美国车企新订单,“未雨绸缪”布局固态电池进展...
来源:澎湃新闻
-
清明小长假点燃春游热潮:多个热门博物馆约满,景区逛出“推背感”
来源:澎湃新闻
-
吉林:一般工商业光伏余电上网电量不超过20%,超出不予接...
来源:澎湃新闻
-
国家电网一季度电网投资同比大增27.7%,创历史同期新高
来源:澎湃新闻
-
蔡强将任保诚区域CEO,负责马来西亚、印尼、越南市场及代...
来源:澎湃新闻
-
广州今年计划供应住宅用地722公顷,着重增加高品质住宅用地供给
来源:澎湃新闻
-
富力地产:广州富力空港假日酒店将被拍卖,起拍价约2.77...
来源:澎湃新闻
-
长三角铁路今预计发送300万人次,加大对重点时段和热门方向的运力投放
来源:澎湃新闻
-
2025清明档电影票房破2亿元
来源:杭州网
-
大公国际:房地产行业对中国经济拖累持续收窄
来源:中国经济网
-
中国机电产品进出口商会:美单边贸易保护主义行为严重扰乱全...
来源:澎湃新闻
-
美联储主席:关税政策的影响可能更为持久,谈论何为合适的货币政策路径为时尚早
来源:澎湃新闻
-
· 市场回暖 中国大宗商品价格指数继续上涨
来源:杭州网
-
· 袜子套装“买3送3”竟是买3双发3双
来源:杭州网
-
碳减排进入精准量化新阶段 太原市碳账户平台上线运行
来源:太原日报
-
多位美联储官员称关税对价格造成的影响或更长久,但市场押注...
来源:澎湃新闻
-
LME伦铜跌超3%创近2个月新低,特朗普贸易战加剧全球经...
来源:澎湃新闻
-
中方连环反制!美股三大期指均跌超3%
来源:杭州网
-
· 新能源二手车市场热度持续升温 交易量创同期新高
来源:杭州网
-
中方在世贸组织起诉美“对等关税”措施,商务部回应
来源:商务部网站