DeepSeek V4和腾讯混元AI模型将于4月推出

据鲸鱼实验室称，DeepSeek V4 和新的腾讯混元模型预计将于 2026 年 4 月推出。

这些同步发布表明中国人工智能（AI）发展正在加速，重点是实际应用而不是基准性能。

DeepSeek V4 被描述为能够生成文本、图像和视频的多模态大型模型。该模型旨在提高编码能力和长期记忆，这是大型语言模型面临的已知挑战。

早些时候的报道，包括《金融时报》的一篇报道，建议在 3 月份发布 DeepSeek V4。 3 月 9 日，DeepSeek 网站上出现了一个更轻的版本“V4 Lite”。

Whale Lab 报告称，OpenRouter 平台上出现了“Healer Alpha”和“Hunter Alpha”两个模型，这表明它们可能是 DeepSeek V4 的早期版本。 Hunter Alpha 被描述为一个具有一百万个令牌上下文窗口的万亿参数模型。 Healer Alpha 被宣传为具有跨模态推理的多模态模型。没有实体正式声称拥有这些模型。

DeepSeek与华为、寒武纪合作，针对中国国产AI芯片优化V4。该公司还与百度合作增强其人工智能搜索功能。

腾讯的新混元模型将由腾讯首席人工智能科学家姚舜宇领导，他于2025年12月加入。该模型拥有约300亿个参数，将专注于上下文学习和代理可用性。

姚是清华大学的毕业生，以其在 ReAct 和 Tree of Thoughts 等人工智能代理框架方面的工作而闻名。据财新报道，他主张从基准测试转向场景驱动的应用程序。

继阿里巴巴和字节跳动等公司在中国推出其他人工智能模型之后，这些产品也相继发布。多模式能力、长期记忆和现实世界代理绩效方面的行业竞争正在加剧。

<小时/>

特色图片来源

Betify Casino 的简单操作：简单的工作模式