谷歌发布Gemini Pro 3.1预览版，推理能力大幅提升

周四，Google 发布了其大型语言模型的最新版本 Gemini Pro 3.1。该模型目前提供预览版，计划在不久的将来全面发布。

行业观察人士指出，Gemini 3.1 Pro 比其前身 Gemini 3 有了显着改进，Gemini 3 于 11 月发布，已经被认为是一款功能强大的工具。谷歌分享了独立基准测试的统计数据，包括“人类的最后考试”，表明新模型的表现明显优于之前的版本。

人工智能初创公司 Mercor 的首席执行官 Brendan Foody 证实了该模型在专业任务基准上的表现。 Foody 在社交媒体帖子中表示：“Gemini 3.1 Pro 目前位居 APEX-Agents 排行榜榜首。”他补充说，该模型的结果表明“代理人在实际知识工作中的进步速度有多快”。

此次发布是在人工智能领域竞争加剧之际发布的。 OpenAI 和 Anthropic 等大公司最近也发布了专为代理工作和多步骤推理而设计的新模型。

视频：Google

<小时/>

Related Stories