据鲸鱼实验室称,DeepSeek V4 和新的腾讯混元模型预计将于 2026 年 4 月推出。

这些同步发布表明中国人工智能(AI)发展正在加速,重点是实际应用而不是基准性能。

DeepSeek V4 被描述为能够生成文本、图像和视频的多模态大型模型。该模型旨在提高编码能力和长期记忆,这是大型语言模型面临的已知挑战。

早些时候的报道,包括《金融时报》的一篇报道,建议在 3 月份发布 DeepSeek V4。 3 月 9 日,DeepSeek 网站上出现了一个更轻的版本“V4 Lite”。

Whale Lab 报告称,OpenRouter 平台上出现了“Healer Alpha”和“Hunter Alpha”两个模型,这表明它们可能是 DeepSeek V4 的早期版本。 Hunter Alpha 被描述为一个具有一百万个令牌上下文窗口的万亿参数模型。 Healer Alpha 被宣传为具有跨模态推理的多模态模型。没有实体正式声称拥有这些模型。

DeepSeek与华为、寒武纪合作,针对中国国产AI芯片优化V4。该公司还与百度合作增强其人工智能搜索功能。

腾讯的新混元模型将由腾讯首席人工智能科学家姚舜宇领导,他于2025年12月加入。该模型拥有约300亿个参数,将专注于上下文学习和代理可用性。

姚是清华大学的毕业生,以其在 ReAct 和 Tree of Thoughts 等人工智能代理框架方面的工作而闻名。据财新报道,他主张从基准测试转向场景驱动的应用程序。

继阿里巴巴和字节跳动等公司在中国推出其他人工智能模型之后,这些产品也相继发布。多模式能力、长期记忆和现实世界代理绩效方面的行业竞争正在加剧。

<小时/>

特色图片来源

  Anthropic 在新一轮大规模融资中估值达 9000 亿美元