TurboQuant技术相关资讯

谷歌开源Gemma 4：KV缓存压缩至3比特省6倍内存综合性能仍待第三方验证

谷歌近期发布开源多模态AI模型Gemma 4，支持视频图像处理，采用Apache 2.0许可证，搭载TurboQuant技术可将KV缓存压缩至3比特实现6倍内存节省，社区反响积极，但性能对比与落地表现仍待验证，winzheng.com Re