DeepSeek立功!OpenAI披露更多o3-mini 模型思考过程
创始人
2025-02-07 13:02:38
0

OpenAI 发言人通过电子邮件告诉 TechCruch:我们为 o3-mini 引入了更新的思维链,旨在让人们更容易理解模型的思维方式。通过此更新,您将能够理解模型的推理,从而对其响应更加清晰和自信。

图片来源: OPENAI

o3-mini 等推理模型在给出结果之前会彻底检查自身事实,这有助于它们避免一些通常会绊倒模型的陷阱 。但代价是推理模型需要更长的时间才能得出解决方案——通常要多花几秒到几分钟。

DeepSeek 的 R1 模型是一种类似于 o3-mini 的“推理”模型,它揭示了其完整的思维过程,许多人工智能研究人员认为这是首选方法。除了使模型更易于研究之外,推理步骤在某些情况下还能提供更好的用户体验,帮助指示模型何时可能走在正确的轨道上,何时可能走在错误的轨道上。

OpenAI 选择不展示 o3-mini 及其前身 o1 和 o1-mini 的完整推理步骤,部分原因是出于竞争原因。相反,用户只能看到推理步骤的摘要 — —有时这些摘要是错误的。

> 当我们在 o1-preview 发布之前向人们介绍情况时,看到 CoT 实况通常会让他们“恍然大悟”,明白这将是一件大事。这些并不是原始的 CoT,但这是向前迈出的一大步,我很高兴我们能与世界分享这种体验。

>

> — Noam Brown (@polynoamial) 2025 年 2 月 6 日

OpenAI 仍未展示 o3-mini 的完整推理步骤,但该公司表示它找到了一种平衡:o3-mini 可以自由思考,然后将其想法组织成更详细的摘要。

OpenAI 发言人继续说道:为了提高清晰度和安全性,我们增加了一个额外的后处理步骤,让模型审查原始思路,删除任何不安全的内容,然后简化任何复杂的想法。此外,这个后处理步骤使非英语用户能够以他们的母语接收思路,从而创造更易于理解和友好的体验。

在上周的 Reddit AMA上,OpenAI 首席产品官 Kevin Weil 暗示这一变化即将到来。

「我们正在努力展示比今天更多的东西——[展示模型思维过程]很快就会出现。」他说。「一切都有待确定——展示所有的思维链会导致竞争性的提炼,但我们也知道人们(至少是高级用户)想要它,所以我们会找到正确的方法来平衡它。」

相关内容

热门资讯

应对Xbox游戏启动卡顿的优化... Xbox用户在启动游戏时频繁遭遇卡在初始屏幕的现象,这严重削弱了游戏乐趣并加剧了挫败感。通过分析根源...
广西男子一口气花38.8万元买... 近日 广西反诈中心 联合田东县公安局成功拦截一起 “虚假投资”类诈骗 帮助群众止损 价值38.8万元...
OpenAI崛起之路:从深度学... 在AI领域,OpenAI的崛起并非偶然,而是经过精心布局和系统演化的结果。其发展历程可以追溯至201...
网银在线项目入选工信部“网络安... 央广网北京8月27日(记者 宓迪)记者获悉,近日,网银在线入选工信部等十四部门联合遴选的2024“网...
橡胶行业创新研发技术中心在青岛... 青岛新闻网讯 8月26日,橡胶行业创新研发技术中心在青岛科技大学正式揭牌。中国橡胶工业协会会长徐文英...
突围进行时 | “稀土之光”照... 编者按: 在自治区党委、政府高位推动下,内蒙古以“起跑就领先”的魄力,按下科技“突围”快进键,锚定稀...
测评|你能分清跟你聊天的是真人... 21世纪经济报道记者 章驰 AI情感陪伴应用在近年突飞猛进,混乱和风险也在累积。目前AI生成带方言、...
华测检测等“鞋底耐磨性能测试装... 天眼查APP显示,近日,上海华测品标检测技术有限公司,华测检测认证集团股份有限公司申请的“鞋底耐磨性...
总台两个项目获中国电影电视技术... 来源:市场资讯 近日,第十八届中国电影电视技术学会科学技术奖评选结果正式揭晓,总台自主研发的“江苏广...
中国AI手机与电脑产业驶入发展... 本报记者 贾丽 近日,“人工智能+”行动迎来重要进展。国务院印发的《关于深入实施“人工智能+”行动的...