测评 秒级更新1T参数:大规模分布式RL中的P2P权重传输 本文介绍了一种基于RDMA的点对点权重更新机制,用于SGLang中的RL工作负载,作为传统NCCL广播方法的补充。该机制兼容所有主流开源模型,通过源端CPU引擎副本和Mooncake TransferEngine实现的P2P RDMA传输, LMSYS RDMA传输 P2P权重更新 分布式RL 5天前 284