测评 SGLang推理加速:原生集成NVIDIA Model Optimizer,实现无缝量化部署 SGLang最新功能原生支持NVIDIA Model Optimizer量化!这一集成简化了从全精度模型到高性能量化端点的整个优化与部署流程,无需多步工具切换。通过SGLang中的ModelOpt API,只需三步即可完成量化(支持NVFP LMSYS SGLang NVIDIA Model Optimizer 模型量化 2026年2月4日 751