测评 SGLang优化GLM4-MoE生产部署:TTFT提升65% Novita AI针对基于SGLang的GLM4-MoE模型开发了一系列生产验证的高效优化策略,涵盖从内核执行到跨节点数据传输的整个推理管道。通过Shared Experts Fusion和Suffix Decoding等技术,在代理编码工 LMSYS GLM4-MoE SGLang 性能优化 2026年2月4日 757