币圈.界39 9btc.com报道,DeepSeekV4发布前夕硬核重磅论文上线。DeepSeek联合北大、清华研究团队提出了一种全新的大模型推理系统——DualPath。该系统通过引入“双路径KV-Cache加载”机制,巧妙利用了集群中闲置的网络带宽,将Agentic大模型负载的离线推理吞吐量提升了最高1.87倍,在线服务吞吐量平均提升了1.96倍。目前,这项研究已在包含多达1152张GPU的集群上完成了大规模验证,支持DeepSeek-V3.2660B等顶级大模型。(AI寒武纪)
声明:本站所有文章内容,均为采集网络资源,不代表本站观点及立场,不构成任何投资建议!如若内容侵犯了原著者的合法权益,可联系本站删除。
