MiniMax 于 2023 年 4 月 12 日发布了 MiniMax M2.7 模型的权重,在中国实验室的开放权重发布浪潮中,对人工智能竞争格局产生了重大影响。
此版本符合中国更广泛的趋势,因为各家公司都争先恐后地公布他们的进步。 MiniMax M2.7 于 3 月份首次发布,在 SWE-Pro 基准测试中得分为 56.22%,与 GPT-5.3-Codex 的结果相匹配。此外,它在 VIBE-Pro 基准测试中取得了 55.6% 的成绩,在 Web、移动和模拟任务的项目交付方面几乎与 Opus 4.6 持平。该模型还在开源模型中的 GDPval-AA 评估中获得了最高的 ELO 评级 1,495。
MiniMax M2.7 的权重现已在 Hugging Face 上提供,并受 NVIDIA 平台支持。然而,由于未经事先书面许可禁止商业使用的许可限制,该版本受到了批评,一些社区成员认为这破坏了其开源分类。 MiniMax 将 M2.7 描述为第一个通过他们称之为“自我进化”的过程参与其自身开发周期的模型。
MiniMax 的发布是在知普人工智能于 4 月 7 日开源其 GLM-5.1 模型之后发布的,该模型在 MIT 许可下运行。该模型包含 7540 亿个参数,可以自主执行工程任务长达 8 小时。相反,阿里巴巴于 4 月 2 日推出了其专有的 API 模型 Qwen 3.6 Plus,引发了对其开源实践承诺的猜测。截至 4 月 11 日,Qwen 3.6 Plus 在 OpenRouter 上仍然免费,但其长期可用性仍不确定。
人们对 DeepSeek V4 模型的期待正在增强,据报道将于 4 月底推出。 DeepSeek创始人梁文峰表示,该模型将运行在华为Ascend芯片上,凸显了中国半导体自给自足的努力。 V4 预计将具有大约一万亿个参数,并利用具有一百万个令牌上下文窗口的专家混合架构,预计还将包括多种变体,例如用于多模式支持的 Vision 模式。尽管经历了两次延迟,但早期压力测试表明公开发布可能即将到来。
<小时/>








