DeepMind发布扩散式文本模型，推理速度飙升10倍

币圈界 2026-06-11 07:27:33 区块链

摘要：Google DeepMind推出全新文本生成模型DiffusionGemma，采用并行块生成机制，实测在Nvidia硬件上吞吐量提升达10倍。该模型首次将扩散架构引入Gemma系列，面向开发者本地部署优化，标志着推理效率新纪元。

币圈界报道：

DeepMind发布扩散式文本生成模型，吞吐量实现质的飞跃

2026年6月10日，Google DeepMind正式推出DiffusionGemma，一款基于扩散机制的新型文本生成模型。该模型突破传统逐字符生成模式，可并行输出完整文本块，显著降低长文本生成延迟。在Nvidia GPU环境下，其每秒处理能力高达1000个token，性能表现远超前代。

并行生成架构显著提升响应效率

与传统自回归模型每次仅输出一个标记不同，DiffusionGemma通过扩散框架同时构建整个文本段落。这一设计不仅大幅缩短生成耗时，还具备自动修复复杂Markdown格式与结构化内容的能力。该特性特别适用于代码生成、文档自动化及数据管道构建等高精度任务场景。

模型已针对Nvidia RTX消费级显卡与DGX企业级系统完成深度优化，支持高效本地部署，为开发团队提供低延迟、高吞吐的推理解决方案。

扩展开放模型生态，切入实际应用落地

作为Gemma系列的首个扩散型变体，DiffusionGemma延续了该家族开放权重的设计理念。过去一年中，DeepMind陆续推出多个适配特定用途的Gemma版本，而此次引入扩散架构，标志着其在生成范式上的关键跃迁。

尽管此前已有研究机构探索扩散文本模型，但多局限于实验环境。DeepMind此次将其整合进成熟工具链，使该技术具备大规模部署潜力。发布时间紧随Anthropic发布Claude Fable 5之后，后者以基准测试成绩著称，而DeepMind则聚焦于真实硬件平台下的原始吞吐量表现，强调实用性和可扩展性。

Nvidia作为核心硬件支撑方，其DGX与RTX系列设备因此进一步巩固了在本地前沿模型推理领域的主导地位。未来市场关注点将集中于开发者采纳进度，以及该模型在非Nvidia平台上的性能迁移能力是否保持一致。

声明：本站所有文章内容，均为采集网络资源，不代表本站观点及立场，不构成任何投资建议！如若内容侵犯了原著者的合法权益，可联系本站删除。

₿

币安 Binance

币安交易所是全球加密货币交易所,注册奖励 500 U

官网注册

DeepMind发布扩散式文本模型，推理速度飙升10倍

币圈界报道：

DeepMind发布扩散式文本生成模型，吞吐量实现质的飞跃

并行生成架构显著提升响应效率

扩展开放模型生态，切入实际应用落地

相关推荐