OpenAI 和谷歌 DeepMind 的 AI 模型在 2025 年国际大学生程序设计竞赛(ICPC)世界总决赛中表现非常出色,甚至超越了顶尖的人类参赛队伍。特别是 OpenAI 的系统,成功解决了全部 12 道题目,获得了满分。
下面这个表格汇总了它们的表现:
OpenAI 如何做到的?
OpenAI 此次并非使用单一的、为竞赛专门训练的模型,而是采用了一个由 GPT-5 和一个未公开的实验性推理模型 组成的“通用推理模型集成体”。
谷歌 Gemini 的表现
谷歌的 Gemini 2.5 Deep Think 高级版本 同样展现了强大实力:
它成功解决了 “问题C” —— 一道关于管道网络液体分配优化的复杂题目,而所有人类参赛队伍都未能解出此题。Gemini 通过假设储液罐有“优先级值”,并应用动态规划算法和极小极大定理,将其转化为寻找最优优先级值的问题,最终通过嵌套三分搜索成功求解。
这次胜利意味着什么?
AI 在顶级编程竞赛中达到金牌水平并超越人类顶尖队伍,确实具有标志性意义:
抽象推理与问题解决能力的飞跃:ICPC 的要求远不止是写代码,更核心的是在巨大压力下进行抽象思维、逻辑推理、算法设计以及高效实现的能力。AI 在此类任务中表现出色,表明其正在从“处理信息”向“解决复杂推理问题”迈进。
成为人类程序员的“伙伴”:这预示着 AI 有潜力成为程序员强大的问题解决伙伴(coding partner),而不仅仅是辅助工具。它可以帮助人类专家查漏补缺、提供新颖思路、优化解决方案,甚至处理那些人类可能忽略或难以解决的棘手问题。
对AGI的展望:谷歌DeepMind副总裁Quoc Le将此称为“朝着通用人工智能(AGI)迈进的历史性时刻”。虽然对此存在不同看法,但无疑显示了AI在通向更通用智能道路上的进步。
也需要一些理性思考
在欢呼的同时,也有一些理性的声音提醒我们:
发表评论 取消回复