测评 SGLang-JAX 在 TPU 上优化 Ling-2.6-1T:单 Pallas 内核隐藏 MoE 数据移动 SGLang-JAX 现已支持 inclusionAI 的 Ling-2.6-1T 在 TPU v7x 上高效部署。通过分析发现 Mixture-of-Experts(MoE)路径是主要瓶颈。全新 Fused MoE V2 内核将 scat LMSYS MoE 优化 TPU 推理 SGLang-JAX 7小时前 10