测评 SGLang Pipeline Parallelism:百万Token上下文扩展与性能突破 SGLang推出高度优化的Pipeline Parallelism(PP)实现,专为超长上下文推理设计。通过集成Chunked Pipeline Parallelism、Asynchronous P2P Communication和Dyna LMSYS SGLang Pipeline Parallelism 超长上下文 2026年2月4日 800