Google 推出了 Gemini 3.1 Flash-Lite,这是迄今为止最快、最实惠的 Gemini 3 型号,价格为每百万输入代币 0.25 美元,每百万输出代币 1.50 美元。

该模型针对大量开发人员工作负载、数据处理和翻译任务。它可以通过 Google AI Studio 和 Vertex AI 中的 Gemini API 进行预览,但不包含在 Gemini 消费者应用程序中。

与 Gemini 2.5 Flash-Lite 相比,新版本价格更高,但功能明显更强大。它通常以较低的价格优于 Gemini 2.5 Flash。

该模型的性能优于 GPT-5 mini 和 Claude 4.5 Haiku 等竞争对手。 Grok 4.1 Fast 更实惠,但 Gemini 3.1 Flash-Lite 速度更快,承诺每秒高达 363 个令牌。

在多模式基准测试中,该模型在 Arena.ai 排行榜上获得了 1432 Elo 分。这使其跻身开放重量模型和最新一代商业产品之列。

谷歌没有发布该版本的代理基准。该公司表示,该模型旨在用于大批量任务和数据处理,而不是用于管理代理团队。

开发人员可以使用 API 来调整模型的推理时间以控制成本。较低的推理设置产生较少的标记,这与大容量工作负载相关。

这是 Gemini 3.1 的第一个 Flash-Lite 版本。谷歌传统上会首先推出功能更强大的 Flash 版本,或者完全跳过 Flash-Lite,就像 Gemini 3 所做的那样。

谷歌两周前推出了 Gemini 3.1 Pro。该公司将 Flash-Lite 描述为适用于大规模开发人员工作负载。

<小时/>

精选图片来源

  HBO Max推出新的内容分级系统