扩散模型相关资讯

谷歌DeepMind发布DiffusionGemma：本地AI运行速度飙升4倍

扩散模型通常用于图像生成，但谷歌DeepMind最新发布的DiffusionGemma模型证明，它同样能大幅加速文本处理。该模型在本地设备上运行速度比传统Transformer模型快4倍，通过将文本生成过程转化为类似图像生成的去噪扩散步骤，

继两月进展更新后，SGLang-Diffusion团队深入剖析了多项高级优化，使其成为可靠的生产级视频生成框架。这些优化聚焦可扩展性、效率与稳定性，针对扩散模型大规模部署的关键瓶颈。核心改进包括：从帧级到Token级SP-Sharding减