测评 让张量翱翔:R-Fork 加速大模型权重加载 本文介绍 Tensor R-Fork(Tensor Remote Fork),一种创新的权重加载方法,利用高效的跨节点设备间互连,从运行中的 SGLang 实例零拷贝加载张量至新实例。该技术带来三大优势:显著加速权重加载(如 Deepsee LMSYS SGLang Tensor R-Fork GPU-Direct RDMA 2026年2月4日 627