测评 SGLang实现确定性推理与可重现RL训练 本文介绍SGLang团队在实现确定性推理方面的努力,以及与slime团队合作推动可重现RL训练的进展。基于Thinking Machines Lab的batch-invariant算子,SGLang实现了完全确定性推理,同时兼容chunke LMSYS SGLang 确定性推理 RL训练 2026年2月4日 806