Google DeepMind发布DiffusionGemma：文本扩散模型实现并行生成，速度提升四倍

2026年6月11日 847 约3分钟 X Hot Topics

DiffusionGemma Google DeepMind 文本扩散模型

Google DeepMind于近日正式发布并开源了DiffusionGemma文本扩散模型，标志着文本生成技术从自回归范式向扩散模型的又一次重要跨越。该模型在并行生成能力上取得显著突破，推理速度较传统方法提升约四倍，同时获得NVIDIA的硬件级支持，开发者社区反响热烈。

技术突破：从自回归到并行扩散

传统大语言模型多采用自回归方式逐词生成文本，这种串行机制限制了生成效率。DiffusionGemma则借鉴图像扩散模型的思路，通过逐步去噪过程实现文本生成，支持多token并行处理。官方测试显示，在相同硬件环境下，其每秒token处理速度（TPS）可轻松突破100，部分场景下较Gemma-2系列提升四倍。

模型基于Gemma架构进行适配，参数量覆盖2B与7B两个版本，均采用Apache 2.0协议开源。这一设计降低了研究门槛，允许开发者直接在Hugging Face平台下载权重并进行微调。

应用场景：代码编辑与长文本生成

DiffusionGemma特别适合需要快速迭代的场景，例如代码补全与编辑。开发者可一次性生成多行代码建议，再根据上下文并行调整，显著缩短开发周期。此外，在长文本摘要、创意写作等领域，其并行生成特性也能减少等待时间。

NVIDIA已将DiffusionGemma集成至TensorRT-LLM推理框架，并提供优化后的CUDA内核。早期用户反馈显示，在A100与H100 GPU上，7B模型的吞吐量提升明显，显存占用也得到优化。

行业影响与生态反应

此次发布被视为扩散模型在文本领域商业化的重要信号。多家初创公司表示将基于DiffusionGemma构建垂直应用，包括智能写作助手与自动化编程工具。学术界则关注其训练稳定性与可解释性，相关论文已在arXiv同步上线。

然而，扩散模型仍面临生成一致性与控制精度等挑战。Google DeepMind在技术报告中承认，模型在高度结构化任务上偶有“幻觉”现象，需要进一步优化采样策略。

未来展望

随着开源生态逐步完善，DiffusionGemma有望成为文本生成领域的重要基准。行业分析人士认为，未来12个月内，基于该模型的衍生工具将大量涌现，推动AI辅助创作进入新阶段。

Google DeepMind表示，将持续收集社区反馈，并计划在后续版本中引入多模态扩散能力。开发者可通过官方GitHub仓库提交issue或贡献代码，共同推动技术演进。

Google DeepMind发布DiffusionGemma：文本扩散模型实现并行生成，速度提升四倍

技术突破：从自回归到并行扩散

应用场景：代码编辑与长文本生成

行业影响与生态反应

未来展望

相关文章