测评 从研究到生产:EAGLE-3在Vertex AI加速开源LLM推理2-3倍 推测解码(Speculative Decoding)能显著提升LLM推理速度,但传统方法需额外训练低效的草稿模型。Vertex AI采用EAGLE-3创新方案,仅在目标模型内部层添加轻量级草稿头(仅占2-5%模型大小),简化训练并实现2x- LMSYS EAGLE-3 Speculative Decoding Vertex AI 2026年2月4日 665