ChatGPT证明了六年难题,图灵奖得主说:高兴早了
创始人
2026-06-08 00:53:06
0

新智元报道

【新智元导读】强化学习之父、图灵奖得主Richard Sutton一针见血:今天的AI,好的部分全是老套路,新颖的部分全是废话。

学术圈最毒的评价之一是:

这项工作既有新意,又很好。

可惜的是,好的部分不新颖,新颖的部分不好。

但强化学习领域的奠基人之一、《强化学习》教科书的作者、图灵奖获得者Richard Sutton,把这个笑话对准了整个生成式AI。

他说:这个评价,适用于今天我们所熟悉的大部分AI。

AI:好的部分不新颖,新颖的部分不好

Sutton的核心论断极其简洁,简洁到残忍。

生成式AI本质上是监督学习。

监督学习的逻辑是:给模型看大量人类创造的样本,让它学会模仿。

模仿得越像,分数越高。

问题来了。

当模型严格按训练数据生成内容时,输出质量很高,因为它在复现人类已经验证过的好东西。但这不新颖。它只是在用不同的排列组合,重新包装人类已经知道的事。

当模型试图偏离训练数据、生成真正新颖的内容时,质量就崩了。因为它没有任何内部机制来判断「这个新东西到底好不好」。它只会生成,不会评估。

这就是那个结构性矛盾:

新颖性和质量,在纯监督学习的框架下,是跷跷板的两端。

你按下一头,另一头就翘起来。

不是工程问题。不是靠堆数据、扩大模型、加更多GPU就能解决的。

Sutton用了一个极其刺眼的类比:「幻觉」——大模型最被人诟病的毛病——本质上就是模型试图「新颖」的副产品。

我们讨厌幻觉,恰恰证明了一件事:我们其实根本不要新颖性。我们只要高质量的模仿。

「好的不新颖,新颖的不好。」

那个笑话里审稿人的毒评,竟然精准描述了整个生成式AI的内在局限。

真正的「发现」,需要三件套

Sutton从第一性原理出发,拆解了创造力的「三位一体公式」

真正的发现(Discovery)=变异(Variation)+评估(Evaluation)+选择性保留(Retention)。

任何真正的创造力与发现,都需要三个步骤,缺一不可:

1. 变异(Variation)产生多样化的可能性。可以是随机的,可以是基于已有知识的,但必须有真正的不确定性——否则不叫探索,叫查表。

3. 选择性保留(Selective Retention)把有价值的变异留下来,让它影响未来的行动和学习。

这三个步骤,不是Sutton的发明。它是自然选择的逻辑,是科学方法的逻辑,是人类学习的逻辑。

进化论:随机基因突变(变异)→环境筛选(评估)→适者生存(选择性保留)。

科学方法:提出假说(变异)→实验验证(评估)→发表论文(选择性保留)。

人类学习:尝试不同解法(变异)→检验对错(评估)→记住有效的方法(选择性保留)。

现在,生成式AI只完成了三位一体的第一步:几乎没有评估,更不要提选择性保留了,

它就像一个会随机射箭的弓箭手,但眼睛是蒙着的,射完之后既不看靶子,也不根据结果调整姿势。

你叫它射一万箭,偶尔会中靶,但它永远不知道为什么中了。

那么,科学家还有没有用?

到这里你可能会有点焦虑:如果未来AI真的能自主完成"发现"的三位一体,科学家是不是就要失业了?

Sutton自己的回答是:不能被取代,但角色要彻底转型。

他在演讲中说,哪怕是能独立证明数学定理的AI,目前仍然需要人类来告诉它:哪些问题是重要的。

这不是谦虚,而是真实的认知边界。

数学家Shiqian Ma,莱斯大学(Rice University)优化领域学者,说:他用ChatGPT,证明了一个让他研究了整整六年的算法收敛性问题。

摘要里有一句话:

证明由ChatGPT 5.5生成,经作者验证。

https://optimization-online.org/2026/05/convergence-of-bdrs-as-a-matrix-scaling-algorithm/

这个算法叫BDRS,全称Bregman Douglas-Rachford Splitting,用于解决最优传输(Optimal Transport)问题。

论文标题:Bregman Douglas-Rachford Splitting Method

预印本地址:https://arxiv.org/abs/2509.08739

这是他和合著者们自己设计的东西,困扰了他六年的,是它的收敛性证明,就是说数学上最严格意义上的「它为什么是对的」。

预印本平台arXiv收到投稿后,至今仍在搁置。

他猜测原因:摘要里有「ChatGPT」三个字,平台不知道该如何处理这类论文。

但人类能被AI取代吗?

他的回答是:不能。他直言:

我认为AI不能创造性地提出这种算法,并声称「这是一种用于最优传输的高效算法,现在让我试着证明它的收敛性」。

没有人类的引导,AI根本不知道该解决哪个问题。

这句话和Sutton精确对应:问题本身,必须由人类来定义。

他花了六年,才「提出正确问题」:

要提出哪些问题,实际上需要你对该主题有非常深入的理解。

就本例而言,我已在这个问题上钻研了六年,因此我清楚地知道其中的难点所在。"

这六年不是浪费,是先决条件。

正是这六年,让他知道这个证明卡在哪,之前所有路径失败的原因是什么,ChatGPT给出的哪个方向值得继续追、哪个是幻觉。

而且不是一次提示,是五个月。这是最容易被误解的地方,他自己也误解过:

从1月到5月,整整五个月,无数次对话,每一次提示都在逼近那个证明。

他总结得极其清醒:

研究的本质没变,还是反复试错。变的是每一次试错的速度——过去需要几周验证一个方向,现在几分钟就能知道这条路走不走得通。

但AI的贡献不可磨灭:

然后,结尾直接封神:

回到我关于BDRS收敛性的论文,我相当确信证明是正确的。

但如果你发现任何错误,责任全由我承担——请不要责怪ChatGPT,它才3.5岁。

这句话妙就妙在双重性:这是真诚的责任声明,也是一个精准的隐喻。

「3.5岁」描述了AI此刻真实的处境:能力惊人,但判断未熟。

毕竟,人类从来没有指望3.5岁的孩童能做什么贡献。

虽然你不能把证明的最终签名权交给AI,但你也不能假装AI没做任何贡献。

这也是为什么,真正的科学发现不会消失在人类手中。

相反,它会更残酷地筛选人类:谁能提出好问题,谁才配拥有强AI。

未来,科学家不借助AI,或许就像天文学家不用电脑一样过时。

最后,我们一起回味Sutton颇具宣言性质的话:

如果我们希望充分发挥AI科学家的全部力量,就应该与他们共享目标,让他们能够创造、评估、发现,从而全面参与实现这些目标。

让我们大胆一点!让我们彻底实现创造力与发现的全自动化!

参考资料:

https://optimization-online.org/2026/05/convergence-of-bdrs-as-a-matrix-scaling-algorithm/

编辑:大卫

秒追ASI

相关内容

热门资讯

夯实基础研究根基 筑牢科技强国... 当前,全球科技竞争进入范式重构的新阶段,基础研究已成为大国博弈的战略支点。4月30日举行的加强基础研...
2026年安卓手机实用配件推荐... 在智能手机功能日益强大的今天,如何通过配件拓展手机的使用场景,成为许多安卓用户的关注焦点。本文将为您...
【一线调研】一张网夯实水安全坚... 央视新闻客户端消息(新闻联播):进入“十五五”时期,我国开始系统推进水网、新型电网、算力网、新一代通...
物联网智能井盖系统厂家梳理 城... 导语:物联网智能井盖系统作为智慧城市基础设施的重要组成部分,其选型需综合评估技术适配性、场景覆盖能力...
ChatGPT证明了六年难题,... 新智元报道 【新智元导读】强化学习之父、图灵奖得主Richard Sutton一针见血:今天的AI...
AI时代文科生如何突围?深技大... “AI替代文科生”的焦虑在社会上蔓延,近日,南都N视频记者获悉,深圳技术大学外国语学院一位青年教师用...
6G:从基础研究到泛在应用 2026年3月,“十五五”规划纲要明确指出了第六代移动通信等成为新的经济增长点,推进第六代移动通信(...
据相关数据显示!辅助挂定制交易... 据相关数据显示!辅助挂定制交易平台!确实是真的有开挂辅助工具(有挂细节)-哔哩哔哩1、辅助挂定制交易...
原创 炸... 近日,一组号称iPhone 20纪念版的概念渲染图在网上疯传,直接把果粉和数码圈都炸懵了。 这台为...
白鹅潭置业首选:2026年荔湾... 2026荔湾置业风向锁定“确定性”资产 在广州楼市进入“价值分化”与“品质为王”的2026年,荔湾区...