测评 SGLang 与 NVIDIA 携手加速 InferenceMAX 基准与 GB200 性能 SGLang 和 NVIDIA 团队紧密合作,针对 NVIDIA Blackwell 架构优化推理性能,利用 FP8 attention、NVFP4 MoE 和 PD-Disaggregated Expert Parallelism 等特性 LMSYS SGLang NVIDIA Blackwell InferenceMAX 2026年2月4日 857