扩散模型相关资讯

谷歌开源DiffusionGemma 260亿参数模型本地生成速度提升4倍

谷歌DeepMind于2026年6月11日发布DiffusionGemma模型，总参数260亿，采用混合专家架构，推理仅激活约38亿参数。在NVIDIA H100上文本生成速度超过1000 token/秒，较传统自回归模型快约4倍。该模型支

SGLang Diffusion 将 SGLang 的顶尖性能扩展至扩散模型的图像和视频生成，支持主流开源模型如 Wan、Hunyuan、Qwen-Image、Qwen-Image-Edit 和 Flux。通过 OpenAI 兼容 API、