周四,Google 发布了其大型语言模型的最新版本 Gemini Pro 3.1。该模型目前提供预览版,计划在不久的将来全面发布。

行业观察人士指出,Gemini 3.1 Pro 比其前身 Gemini 3 有了显着改进,Gemini 3 于 11 月发布,已经被认为是一款功能强大的工具。谷歌分享了独立基准测试的统计数据,包括“人类的最后考试”,表明新模型的表现明显优于之前的版本。

人工智能初创公司 Mercor 的首席执行官 Brendan Foody 证实了该模型在专业任务基准上的表现。 Foody 在社交媒体帖子中表示:“Gemini 3.1 Pro 目前位居 APEX-Agents 排行榜榜首。”他补充说,该模型的结果表明“代理人在实际知识工作中的进步速度有多快”。

此次发布是在人工智能领域竞争加剧之际发布的。 OpenAI 和 Anthropic 等大公司最近也发布了专为代理工作和多步骤推理而设计的新模型。

视频:Google

<小时/>

精选图片来源

  为什么 OpenAI 最终杀死了 GPT-4o