谷歌开源DiffusionGemma 260亿参数模型本地生成速度提升4倍
谷歌DeepMind于2026年6月11日发布DiffusionGemma模型,总参数260亿,采用混合专家架构,推理仅激活约38亿参数。在NVIDIA H100上文本生成速度超过1000 token/秒,较传统自回归模型快约4倍。该模型支
谷歌DeepMind于2026年6月11日发布DiffusionGemma模型,总参数260亿,采用混合专家架构,推理仅激活约38亿参数。在NVIDIA H100上文本生成速度超过1000 token/秒,较传统自回归模型快约4倍。该模型支
SGLang Diffusion 将 SGLang 的顶尖性能扩展至扩散模型的图像和视频生成,支持主流开源模型如 Wan、Hunyuan、Qwen-Image、Qwen-Image-Edit 和 Flux。通过 OpenAI 兼容 API、