根据 2026 年 2 月 24 日发布的每周数据,中国构建的大型语言模型目前占全球最大的 LLM API 聚合平台 OpenRouter 代币消耗总量的 61%。该平台上最常用的三个模型均由中国 AI 实验室开发。

MiniMax M2.5 以单周消费 2.45 万亿代币位居榜首,较前一周增长 197%。 Moonshot AI 的 Kimi K2.5 紧随其后,拥有 1.21 万亿代币,但其使用量每周下降 20%。智浦AI的GLM-5在飙升158%后以7800亿代币排名第三。 DeepSeek V3.2在平台所有模型中排名第五。该平台前 10 名机型消耗的 8.7 万亿代币中,中国机型合计占 5.3 万亿。

MiniMax M2.5 使用量激增的部分原因是免费促销访问。 Kilo Code 是一款人工智能驱动的编码工具,从 2 月 12 日开始,为期一周免费提供该模型。另一款开发工具 Cline 也进行了类似的促销活动。

MiniMax M2.5 在 SWE-Bench Verified 上的得分为 80.2%,与 Anthropic 的 Claude Opus 4.6 的 80.8% 相差不大。

编程已成为 OpenRouter 上最大的代币消耗类别,到 2025 年,其占代币总数的比例将从 11% 增长到 50% 以上。代理驱动的工作流程(其中模型自主执行多步骤任务)目前占平台上所有输出代币的一半以上。

OpenRouter 首席运营官 Chris Clark 表示,中国的开放权重模型在美国公司运营的代理流量中占比过大。本周排名最高的所有三个中国模型都针对编码和代理自动化进行了优化。

成本仍然是一个决定性因素。 MiniMax M2.5 每百万输入代币收费 0.30 美元,每百万输出代币收费 1.10 美元。 GLM-5 的定价为每百万个输入代币 0.30 美元,每百万个输出代币 2.55 美元。相比之下,Claude Opus 4.6 每百万个输入代币的成本为 5 美元,每百万个输出代币的成本为 25 美元,大约贵 10 到 20 倍。

OpenRouter每周代币消耗总量已达到约12.1万亿枚,较一年前增长12.7倍。该平台由前 OpenSea 首席技术官 Alex Atallah 创立,为来自 60 多家提供商的 400 多个模型提供统一的 API 网关。

  xAI 在公共视频中详细介绍了 Grok 和 Macrohard 的产品路线图

Andreessen Horowitz 合伙人 Martin Casado 估计,大约 80% 使用开源 AI 堆栈的初创公司都在运行中国模型。 《麻省理工科技评论》报道称,中国开放重量模型在硅谷的采用正在加速。

<小时/>

精选图片来源