测评 单H200部署1TB模型:INT4 QAT RL端到端实践 受Kimi K2团队启发,SGLang RL团队成功实现INT4 Quantization-Aware Training (QAT)全流程。通过训练阶段的fake quantization和推理阶段的真实W4A16量化,实现了与BF16全精 LMSYS INT4 QAT 量化感知训练 RL训练 2026年2月4日 671