币圈界报道,4月10日DeeepSeek官方博客发文介绍DeepSeek V4,DeepSeek V4是DeepSeek即将推出的旗舰模型,它不仅突破了参数规模的极限,更承诺带来前所未有的效率。DeepSeek V4预计可处理1 万亿 (1T) 个参数,原生支持文本、图像、视频和音频等多模态数据,并拥有100万个词元的上下文窗口(相当于15-20部完整的小说),使其成为OpenAI的GPT-5.4和Anthropic的Claude Opus 4.5等西方巨头的直接竞争对手。DeepSeek V4的API定价比GPT-5.4和Claude Opus 4.5便宜10-50倍;预计DeepSeek V4将采用 Apache 2.0 许可协议开源权重;DeepSeek V4可在本地双 RTX 4090 或单 RTX 5090 上运行。 DeepSeek还介绍了DeepSeek V4的3项突破性的创新:1、Engram条件记忆; 2、流形约束超连接(mHC); 3、稀疏注意力机制 (DSA) 和Lightning索引器。 此外,DeepSeek官方还表示,由于美国对英伟达高端 GPU(例如B300和H200)的出口有着严格的限制,DeepSeek对V4进行了优化,使其能够主要依靠中国国产芯片进行推理。虽然初始训练可能仍然使用了英伟达硬件(例如H800s),但该模型针对华为 Ascend 950PR和Cambricon MLU芯片进行了高度优化。