测评 异构CPU+GPU EPD解耦提升VLM服务性能 Intel与SGLang团队合作,通过Dynamo和SGLang实现了异构Encode-Prefill-Decode(EPD)解耦方案,用于视觉语言模型(VLM)服务优化。方案将视觉编码任务卸载至CPU(尤其是头节点CPU),利用Intel LMSYS VLM服务 EPD解耦 SGLang 7小时前 17