热搜词:

OpenAI研究人员夸大GPT-5数学能力, 遭杨立昆等业界人士批评

IT之家10月19日消息,近日,OpenAI研究人员在社交媒体平台X上宣称取得了一项重大数学突破,但很快在学界批评声中撤回了这一说法。批评者包括DeepMind首席执行官德米斯・哈萨比斯(DemisHassabis),他指出该团队的沟通方式“过于草率”。

事件起源于OpenAI管理层成员凯文・韦尔(KevinWeil)发布的一条现已删除的推文。他在文中声称,GPT-5已“找到了10个(!)此前未解的埃尔德什(Erdős)问题的解决方案”,并在另外11个问题上取得了进展。他形容这些问题“数十年来一直悬而未决”。其他OpenAI研究人员也附和了这一说法。

这些措辞给人的印象是:GPT-5独立生成了数论领域若干难题的数学证明——这将是一项潜在的重大科学突破,也标志着生成式人工智能有能力发现未知解,推动原创性研究,并开启科技发展的新篇章。

然而,运营网站erdosproblems.com的数学家托马斯・布鲁姆(ThomasBloom)立即提出异议。他称这一说法是“严重的误解”,并澄清道:其网站上的“开放问题”仅表示他自己尚不了解答案,并不意味着这些问题在学术界真正未被解决。事实上,GPT-5只是检索到了布鲁姆此前未曾注意到的已有研究成果。

DeepMindCEO德米斯・哈萨比斯将此次事件称为“令人尴尬的”,MetaAI负责人杨立昆(YannLeCun)则讽刺OpenAI“被自己的炒作所反噬”(hoistedbytheirownGPTards)。

IT之家注意到,相关原始推文随后大多被删除,研究人员也承认了错误。尽管如此,这一事件进一步加剧了外界对OpenAI作为一家机构正面临巨大压力且行事不够严谨的看法。人们不禁质疑:在一个本就充满炒作、涉及数十亿美元利益的领域中,为何顶尖AI研究人员会未经核实便发布如此惊人的声明?事实上,即便像Bubeck这样了解GPT-5真实贡献的研究者,仍使用了“找到解决方案”这种具有误导性的模糊表述。

被忽视的真正重点在于:GPT-5在此过程中展现的实际价值,是作为一种高效的研究工具,用于追踪和整合相关的学术论文。这对于文献分散或术语不统一的研究问题尤其有价值。

著名数学家陶哲轩(TerenceTao)认为,这才是人工智能在数学领域最直接的应用潜力所在——并非攻克最难的开放性问题,而是加速诸如文献检索等繁琐工作。他表示,虽然AI在个别复杂问题上已有“零星进展”,但目前最主要的作用仍是节省时间的辅助工具。他还指出,生成式AI有望帮助“工业化”数学研究进程,从而加快整个领域的进步步伐。不过,他也强调,人类专家在审查、分类以及安全地将AI生成结果融入正式研究方面,仍然发挥着不可替代的关键作用。