阿里巴巴Qwen遭Anthropic指控蒸馏Claude输出 模型蒸馏伦理争议升级

近日,人工智能领域爆发一起备受关注的争议事件。美国AI公司Anthropic公开指控阿里巴巴旗下的Qwen实验室涉嫌通过大规模调用Claude API进行模型蒸馏,提取其推理轨迹用于训练竞品模型。此举被指违反Anthropic服务条款,引发业界对AI训练伦理、知识产权保护以及开源与闭源模型公平竞争的热烈讨论。

据Anthropic透露,Qwen团队可能利用数百万次API查询,系统性地收集Claude在复杂推理任务中的中间步骤和输出轨迹。这些数据随后被用于蒸馏训练,旨在让Qwen模型在数学、编程和逻辑推理等能力上快速追赶Claude。这一指控迅速在社交平台X上发酵,相关帖文点赞量已突破千次。

模型蒸馏作为一种常见技术,允许开发者用大型模型的输出训练更小、更高效的模型,以降低推理成本。然而,当蒸馏对象涉及商业API且规模化提取其核心推理能力时,边界问题便凸显出来。Anthropic在声明中强调,此类行为不仅损害其商业利益,也可能削弱整个行业对API服务的信任。

阿里巴巴方面尚未对此作出正式回应。但Qwen系列模型在开源社区的快速迭代,一直被视为中国AI力量的重要代表。此前Qwen2等版本已在多个基准测试中接近或超越部分国际闭源模型,其背后的训练方法因此备受 scrutiny。

这一事件将AI蒸馏技术的合法性与道德性推向风口浪尖。支持者认为,开源模型通过合法数据蒸馏加速追赶,有助于技术普惠;批评者则担忧,若无明确规则,API提供商的知识产权将难以保障,进而抑制创新投入。

行业分析师指出,类似争议可能推动API服务商加强监控机制,如限制查询频率、添加水印或调整服务条款。同时,监管层面也可能介入,制定AI数据使用的新规范。

无论最终结果如何,此次指控已促使全球AI开发者重新审视蒸馏边界的伦理问题。在开源追赶闭源的激烈竞争中,如何平衡效率与公平,仍将是长期课题。