DeepSeek 于 2023 年 4 月 24 日发布 V4 大语言模型后不久,于周六宣布其 API 服务大幅降价。此次降价将输入缓存命中费用降低至之前费用的十分之一,并在 2023 年 5 月 5 日之前为 V4-Pro 模型提供 75% 的折扣。
V4-Pro 的输入缓存命中价格已降至每百万代币 0.025 元(约 0.0036 美元)。促销期间标准价格为每百万代币投入3元,产出6元。根据 OpenRouter 的数据,这种定价策略明显低于竞争对手,Anthropic、OpenAI 和 Google 的模型定价在每百万代币 12 至 25 美元之间。
DeepSeek 以预览版形式推出了 V4-Pro 和 V4-Flash,这是该公司自 2022 年 12 月推出 V3.2 版本以来首次推出重要模型。V4-Pro 拥有 1.6 万亿个参数,每个推理过程有 490 亿个活动参数,使其成为目前可用的最大的开放权重模型。 V4-Flash 具有更小的配置和 2840 亿个参数。
即使在最近的削减之前,V4-Pro 的标准价格也是每百万代币输入 1.74 美元,输出 3.48 美元,比 OpenAI 的 GPT-5.5 Pro 的定价低约 98%。最新的折扣进一步扩大了这种竞争优势。
在人工智能领域计算能力成本不断上升的情况下,DeepSeek 的战略与行业内更广泛的降价趋势相一致。据格隆汇报道,该公司已全面拥抱“AI降价”理念。
值得注意的是,V4 在华为 Ascend 硬件上运行,而不是 Nvidia 芯片,观察人士认为这可能会促进人工智能系统在国内的采用。 Counterpoint Research 首席人工智能分析师 Wei Sun 表示,这一发展使得人工智能系统的部署不再仅仅依赖 Nvidia,有可能加速国内和全球人工智能的进步。
V4-Pro 展示了显着的效率,对于一百万个令牌上下文窗口,仅需要其前身 V3.2 的 27% 的计算能力。尽管取得了进步,但 DeepSeek 承认,正如该公司的技术论文中所述,V4 在性能方面仍然落后于 GPT-5.4 和 Gemini 3.1 Pro 等领先模型大约三到六个月。
<小时/>








