Gemma 4 相关AI资讯 | 赢政天下 AI

谷歌Gemma 4开源模型采用推测解码，速度提升3倍

谷歌最新发布的Gemma 4开源AI模型引入了“推测解码”（Speculative Decoding）技术，通过辅助模型预先生成多个令牌再由主模型并行验证，在保持输出质量的同时将推理速度提升最高3倍。这一创新将两个模型合并为一个稀疏专家混合

谷歌近期发布开源多模态AI模型Gemma 4，支持视频图像处理，采用Apache 2.0许可证，搭载TurboQuant技术可将KV缓存压缩至3比特实现6倍内存节省，社区反响积极，但性能对比与落地表现仍待验证，winzheng.com Re

Google DeepMind据报道发布Gemma 4系列开源模型，支持文本、图像和音频多模态，可在消费级硬件如树莓派上运行。该系列包括31B和26B A4B变体，优化代理工作流和边缘计算，开发者社区反响热烈。但性能对比和实际应用待验证，此

谷歌近日宣布推出Gemma 4，这是其开源AI模型系列一年来的首次重大更新。新一代模型在性能上显著提升，支持更广泛的应用场景，同时谷歌将许可从原有Gemini许可切换至更宽松的Apache 2.0。这标志着谷歌在开源AI领域的进一步开放，有