谷歌Gemma 4开源模型采用推测解码,速度提升3倍
谷歌最新发布的Gemma 4开源AI模型引入了“推测解码”(Speculative Decoding)技术,通过辅助模型预先生成多个令牌再由主模型并行验证,在保持输出质量的同时将推理速度提升最高3倍。这一创新将两个模型合并为一个稀疏专家混合
谷歌最新发布的Gemma 4开源AI模型引入了“推测解码”(Speculative Decoding)技术,通过辅助模型预先生成多个令牌再由主模型并行验证,在保持输出质量的同时将推理速度提升最高3倍。这一创新将两个模型合并为一个稀疏专家混合
谷歌近日宣布推出Gemma 4,这是其开源AI模型系列一年来的首次重大更新。新一代模型在性能上显著提升,支持更广泛的应用场景,同时谷歌将许可从原有Gemini许可切换至更宽松的Apache 2.0。这标志着谷歌在开源AI领域的进一步开放,有