测评 SGLang在NVIDIA GB300 NVL72上实现25倍推理性能飞跃 SGLang团队与NVIDIA紧密合作,在多代GPU上为大规模MoE推理模型部署带来阶跃式性能提升。继Blackwell B200对比Hopper H200实现4倍加速后,现扩展至Blackwell Ultra的GB300 NVL72,在I LMSYS SGLang NVIDIA GB300 推理性能 2026年3月5日 605