测评 SGLang-Jax:原生TPU推理的开源利器 SGLang-Jax是由SGLang-Jax团队推出的全新开源推理引擎,完全基于Jax和XLA构建。它融合SGLang的高性能服务器架构,利用Jax编译模型前向传播,实现快速原生TPU推理,同时支持连续批处理、前缀缓存、张量并行、专家并行、 LMSYS SGLang-Jax TPU推理 Jax优化 2026年2月4日 719