币圈界报道:

DeepMind发布扩散式文本生成模型,吞吐量实现质的飞跃

2026年6月10日,Google DeepMind正式推出DiffusionGemma,一款基于扩散机制的新型文本生成模型。该模型突破传统逐字符生成模式,可并行输出完整文本块,显著降低长文本生成延迟。在Nvidia GPU环境下,其每秒处理能力高达1000个token,性能表现远超前代。

并行生成架构显著提升响应效率

与传统自回归模型每次仅输出一个标记不同,DiffusionGemma通过扩散框架同时构建整个文本段落。这一设计不仅大幅缩短生成耗时,还具备自动修复复杂Markdown格式与结构化内容的能力。该特性特别适用于代码生成、文档自动化及数据管道构建等高精度任务场景。

模型已针对Nvidia RTX消费级显卡与DGX企业级系统完成深度优化,支持高效本地部署,为开发团队提供低延迟、高吞吐的推理解决方案。

扩展开放模型生态,切入实际应用落地

作为Gemma系列的首个扩散型变体,DiffusionGemma延续了该家族开放权重的设计理念。过去一年中,DeepMind陆续推出多个适配特定用途的Gemma版本,而此次引入扩散架构,标志着其在生成范式上的关键跃迁。

尽管此前已有研究机构探索扩散文本模型,但多局限于实验环境。DeepMind此次将其整合进成熟工具链,使该技术具备大规模部署潜力。发布时间紧随Anthropic发布Claude Fable 5之后,后者以基准测试成绩著称,而DeepMind则聚焦于真实硬件平台下的原始吞吐量表现,强调实用性和可扩展性。

Nvidia作为核心硬件支撑方,其DGX与RTX系列设备因此进一步巩固了在本地前沿模型推理领域的主导地位。未来市场关注点将集中于开发者采纳进度,以及该模型在非Nvidia平台上的性能迁移能力是否保持一致。