Google 推出 Gemini 3.1 Flash-Lite 作为最快的低成本 Gemini 型号

Google 推出了 Gemini 3.1 Flash-Lite，这是迄今为止最快、最实惠的 Gemini 3 型号，价格为每百万输入代币 0.25 美元，每百万输出代币 1.50 美元。

该模型针对大量开发人员工作负载、数据处理和翻译任务。它可以通过 Google AI Studio 和 Vertex AI 中的 Gemini API 进行预览，但不包含在 Gemini 消费者应用程序中。

与 Gemini 2.5 Flash-Lite 相比，新版本价格更高，但功能明显更强大。它通常以较低的价格优于 Gemini 2.5 Flash。

该模型的性能优于 GPT-5 mini 和 Claude 4.5 Haiku 等竞争对手。 Grok 4.1 Fast 更实惠，但 Gemini 3.1 Flash-Lite 速度更快，承诺每秒高达 363 个令牌。

在多模式基准测试中，该模型在 Arena.ai 排行榜上获得了 1432 Elo 分。这使其跻身开放重量模型和最新一代商业产品之列。

谷歌没有发布该版本的代理基准。该公司表示，该模型旨在用于大批量任务和数据处理，而不是用于管理代理团队。

开发人员可以使用 API 来调整模型的推理时间以控制成本。较低的推理设置产生较少的标记，这与大容量工作负载相关。

这是 Gemini 3.1 的第一个 Flash-Lite 版本。谷歌传统上会首先推出功能更强大的 Flash 版本，或者完全跳过 Flash-Lite，就像 Gemini 3 所做的那样。

谷歌两周前推出了 Gemini 3.1 Pro。该公司将 Flash-Lite 描述为适用于大规模开发人员工作负载。

<小时/>

Related Stories