MiniMax M2.7 在测试中符合顶级编码基准

MiniMax 于 2023 年 4 月 12 日发布了 MiniMax M2.7 模型的权重，在中国实验室的开放权重发布浪潮中，对人工智能竞争格局产生了重大影响。

此版本符合中国更广泛的趋势，因为各家公司都争先恐后地公布他们的进步。 MiniMax M2.7 于 3 月份首次发布，在 SWE-Pro 基准测试中得分为 56.22%，与 GPT-5.3-Codex 的结果相匹配。此外，它在 VIBE-Pro 基准测试中取得了 55.6% 的成绩，在 Web、移动和模拟任务的项目交付方面几乎与 Opus 4.6 持平。该模型还在开源模型中的 GDPval-AA 评估中获得了最高的 ELO 评级 1,495。

MiniMax M2.7 的权重现已在 Hugging Face 上提供，并受 NVIDIA 平台支持。然而，由于未经事先书面许可禁止商业使用的许可限制，该版本受到了批评，一些社区成员认为这破坏了其开源分类。 MiniMax 将 M2.7 描述为第一个通过他们称之为“自我进化”的过程参与其自身开发周期的模型。

MiniMax 的发布是在知普人工智能于 4 月 7 日开源其 GLM-5.1 模型之后发布的，该模型在 MIT 许可下运行。该模型包含 7540 亿个参数，可以自主执行工程任务长达 8 小时。相反，阿里巴巴于 4 月 2 日推出了其专有的 API 模型 Qwen 3.6 Plus，引发了对其开源实践承诺的猜测。截至 4 月 11 日，Qwen 3.6 Plus 在 OpenRouter 上仍然免费，但其长期可用性仍不确定。

人们对 DeepSeek V4 模型的期待正在增强，据报道将于 4 月底推出。 DeepSeek创始人梁文峰表示，该模型将运行在华为Ascend芯片上，凸显了中国半导体自给自足的努力。 V4 预计将具有大约一万亿个参数，并利用具有一百万个令牌上下文窗口的专家混合架构，预计还将包括多种变体，例如用于多模式支持的 Vision 模式。尽管经历了两次延迟，但早期压力测试表明公开发布可能即将到来。

<小时/>

精选图片来源

Doppl 推出时尚购物 AI 发现源

MiniMax M2.7 在测试中符合顶级编码基准

Related Stories

苹果在 beta 3 中带来了更多个性化的 Siri 语音控制

人择研究发现克劳德模型形成类似于意识的内部工作空间

苹果在 watchOS 27 beta 3 中激活 Apple Watch 上的 Siri AI

《中途旅程》促使迪士尼和其他公司在诉讼中披露内部人工智能的使用情况