测评 SGLang 当日即支持高效开源 Nemotron 3 Nano 混合 MoE 模型 SGLang 快速集成 NVIDIA 最新发布的 Nemotron 3 Nano 模型,该模型采用混合 Transformer-Mamba 架构与 MoE 设计,总参数 30B、激活参数仅 3.6B,支持 1M 上下文长度。在 NVFP4 LMSYS SGLang Nemotron 3 Nano NVIDIA 2026年2月4日 730