测评 INT4 QAT RL 实战:单 H200 部署 1TB 模型 SGLang RL 团队受 Kimi K2 启发,成功落地 INT4 Quantization-Aware Training (QAT) 端到端方案。通过训练阶段的 fake quantization 与推理阶段 W4A16 真实量化结合, LMSYS INT4 QAT SGLang RL 模型量化 6小时前 20