首页 > 综合

OpenAI研究人员夸大GPT-5数学能力, 遭杨立昆等业界人士批评

IT之家10月19日消息，近日，OpenAI研究人员在社交媒体平台X上宣称取得了一项重大数学突破，但很快在学界批评声中撤回了这一说法。批评者包括DeepMind首席执行官德米斯・哈萨比斯（DemisHassabis），他指出该团队的沟通方式“过于草率”。

事件起源于OpenAI管理层成员凯文・韦尔（KevinWeil）发布的一条现已删除的推文。他在文中声称，GPT-5已“找到了10个（！）此前未解的埃尔德什（Erdős）问题的解决方案”，并在另外11个问题上取得了进展。他形容这些问题“数十年来一直悬而未决”。其他OpenAI研究人员也附和了这一说法。

这些措辞给人的印象是：GPT-5独立生成了数论领域若干难题的数学证明——这将是一项潜在的重大科学突破，也标志着生成式人工智能有能力发现未知解，推动原创性研究，并开启科技发展的新篇章。

然而，运营网站erdosproblems.com的数学家托马斯・布鲁姆（ThomasBloom）立即提出异议。他称这一说法是“严重的误解”，并澄清道：其网站上的“开放问题”仅表示他自己尚不了解答案，并不意味着这些问题在学术界真正未被解决。事实上，GPT-5只是检索到了布鲁姆此前未曾注意到的已有研究成果。

DeepMindCEO德米斯・哈萨比斯将此次事件称为“令人尴尬的”，MetaAI负责人杨立昆（YannLeCun）则讽刺OpenAI“被自己的炒作所反噬”（hoistedbytheirownGPTards）。

IT之家注意到，相关原始推文随后大多被删除，研究人员也承认了错误。尽管如此，这一事件进一步加剧了外界对OpenAI作为一家机构正面临巨大压力且行事不够严谨的看法。人们不禁质疑：在一个本就充满炒作、涉及数十亿美元利益的领域中，为何顶尖AI研究人员会未经核实便发布如此惊人的声明？事实上，即便像Bubeck这样了解GPT-5真实贡献的研究者，仍使用了“找到解决方案”这种具有误导性的模糊表述。

被忽视的真正重点在于：GPT-5在此过程中展现的实际价值，是作为一种高效的研究工具，用于追踪和整合相关的学术论文。这对于文献分散或术语不统一的研究问题尤其有价值。

著名数学家陶哲轩（TerenceTao）认为，这才是人工智能在数学领域最直接的应用潜力所在——并非攻克最难的开放性问题，而是加速诸如文献检索等繁琐工作。他表示，虽然AI在个别复杂问题上已有“零星进展”，但目前最主要的作用仍是节省时间的辅助工具。他还指出，生成式AI有望帮助“工业化”数学研究进程，从而加快整个领域的进步步伐。不过，他也强调，人类专家在审查、分类以及安全地将AI生成结果融入正式研究方面，仍然发挥着不可替代的关键作用。