谷歌Gemini 2.5人工智能模型在2025年国际大学生编程竞赛(ICPC)世界总决赛中取得突破性表现,解决了12个复杂算法问题中的10个,获得金牌。谷歌表示,这一壮举是由日常应用中使用的通用人工智能完成的,突显了生成式人工智能在通用人工智能方面取得了重大进展。 ICPC 是世界上规模最大、历史最悠久的大学生编程竞赛,在 5 小时内向参与者挑战 12 个复杂的编码难题,测试在压力下解决问题的能力。
在人工智能与学术竞赛的新颖整合中,谷歌将其 Gemini 2.5 Deep Think 变体连接到了 ICPC 批准的远程在线环境。来自世界各地大学的 139 支人类团队在人工智能开始处理之前领先 10 分钟。与今年早些时候为国际数学奥林匹克竞赛等活动训练的专门模型不同,这个版本的 Gemini 没有经过重新训练,而是经过增强,可以在整个五个小时的持续时间内维持连续的“思考令牌”。这使得模型能够不间断地有条不紊地分析和生成解决方案。
比赛结束时,Gemini 的 10 个正确解决方案使其在大学团队中排名第二,超过了除四个同样达到金牌门槛的人类团队之外的所有团队。评分系统仅对正确答案进行评分,更快的提交可以提高排名。值得注意的是,Gemini 在前 45 分钟内解决了 8 个问题,显示出快速的初步进展。整个挑战的总时间投入达到 677 分钟,反映了所需的计算深度。 ICPC 主任 Bill Poucher 赞扬了这一里程碑,他表示:“ICPC 一直致力于制定解决问题的最高标准。Gemini 成功加入这一领域并取得黄金级成果,标志着定义下一代所需的人工智能工具和学术标准的关键时刻。”
谷歌已在 GitHub 上公开了 Gemini 的所有解决方案,邀请开发者社区进行审查。在这些问题中,问题C因其复杂性而脱颖而出,难倒了每个人类团队。这种多维优化任务涉及管理虚拟的“笨拙”水库,其具有无限可能的存储和排水率配置。 Gemini 创新地通过为每个水库分配优先级值,应用动态规划来简化搜索空间。经过 30 分钟的密集处理,人工智能采用嵌套三元搜索来识别最佳设置,提供精确的解决方案。
为了扩展评估,Google 在之前的 ICPC 数据集上测试了 Gemini 2.5,结果显示 2023 年和 2024 年问题集的金牌表现。内部分析证实了该模型在处理高级算法挑战方面的一致性。这一成功凸显了 Gemini 超越竞争的潜力,使其成为半导体工程和生物技术等高风险行业的宝贵工具。这些领域通常需要多步骤逻辑推理来优化设计或模拟生物过程——人工智能可以加速创新并解决长期存在的问题。
谷歌强调了人工智能的协作优势,指出将 Gemini 的能力与顶尖的人类大学团队相结合将在所有 12 个问题上获得满分。这种协同作用可以增强人类的专业知识,促进复杂领域的突破。然而,该实验的计算需求很大。虽然谷歌没有透露确切的功耗或成本,但这种规模的模型的五小时推理运行意味着大量的资源使用。由于高能源需求,当前的消费者人工智能应用已经使盈利能力紧张,但支持者认为,为以前棘手的问题(如 ICPC 中的问题)提供解决方案可以通过研究和工业领域的变革性应用来抵消费用。
这次 ICPC 的参与不仅仅代表了 Google 的一次宣传胜利;它标志着人工智能领域的成熟,生成模型可以与人类精英人才展开竞争。随着大型科技公司继续在人工智能开发上进行大量投资——在文本摘要和网络处理工具上的支出相当大——这样的事件验证了对“真正智能”的追求。对于每年解决 ICPC 艰巨难题的数千名学生编码员来说,Gemini 的参赛提出了有关教育、竞争和人工智能辅助解决问题的未来的有趣问题。随着解决方案现已开放供审查,世界各地的开发人员可以探索此类人工智能推理如何发展以解决现实世界的编码难题。








