测评 🚀 AutoRound 携手 SGLang:高效量化模型推理新纪元 Intel Neural Compressor 团队宣布 AutoRound 与 SGLang 正式合作,支持低比特量化以实现高效 LLM 推理。AutoRound 通过符号梯度优化技术,实现 INT2-INT8 等低比特量化,在 INT2 LMSYS AutoRound SGLang 模型量化 2026年2月4日 817